开发者学堂课程【机器学习实战:机器学习 PAI 介绍】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/530/detail/7138
机器学习 PAI 介绍
内容介绍
一、 特点
二、 产品组成
三、 PAI 支持的算法
四、 PAI 深度学习框架
五、 离线模型、在线模型
阿里云机器学习平台 PAI 是基于 MaxCompute 提供数据处理、建模、离线预测、在线预测等服务的大型机器学习平台,为算法开发者提供了丰富的 MPI、PS、BSP等编程框架和数据存取接口,同时提供了基于 Web 的可视化控制台,降低了使用门槛。因为 PAI 也支持阿里云的另一款产品 OSS 可视化存储,就是将数据存储到 OSS 中也可以使用 API 进行机器学习。
一、特点
1、 上手简单
通过对底层的分布式算法封装,提供拖拉拽的可视化操作环境。让数据挖掘的创建过程像搭积木一样简单
2、 算法丰富
提供特征工程、数据预处理、统计分析、机器学习、深度学习框架、预测估等超过100 种的算法组件。基本上常见的算法在机器学习 PAI 里面都可以看见。阿里云在机器学习中有非常多很成熟的应用。
3、—站式体验
除了提供模型训练功能,还提供了在线预测以及离线调度功能,让机器学习训练结果和业务可以无缝衔接。因为案例云提供了很多与大数据相关的产品,一个比较大的优势在于可以提供完整的解决方案,机器学习就是这种完整解决方案中的一个环节。并不是孤立存在的,所以对于用户来说就有了一种非常好的一站式体验。
4、 深度学习
目前支持 MXNet 、Caff 目前支持 MXNet 、Caff 的深度学习框架,平台底层提供 GPU 进行训练
5、 其他特点
高性能云端计算,降低存储和计算成本
阿里云机器学习平台 PAI 可以使用 MaxCompute 和对象存储 OSS,实际上MaxCompute 和 OSS 就是基于阿里底层服务计算存储的一个服务,其存储成本和计算成本都比较低,
API 提供了丰富的工具、算法库、降低技术门槛,
提供了基层的可视化拖拽操作完整的解决方案。
二、PAI 产品组成
1、 PAI 的产品组成比较多,包括基础设施有 CPU 集群,GPU 集群,FPGA 集群
2、 开放框架:
MPI、PS、Graph、TensorFlow、Caffe、MXNet 等
3、 模型与算法:
数理统计、数据预处理、特征工程、文本分析、关系网分析、回归分类、聚类和CNN、DNN、RNN 等。
4、 业务应用层:
信用评估、金融风控、疾病预测、图片分类、新闻分类、天气预测、路线分析和推荐系统等等。
5、 平台服务:
离线训练、评估和预测、模型可视化、在线预测和社区服务等等。
三、PAI 支持的算法
目前 PAI 支持的算法非常多,包括一千多种,下图已经不是最新的了,因为 PAI 算法一直在更新,包括预处理工作组件、特征工程、统计分析、常用机器学习算法和垂直应用、深度学习等等,还是非常丰富的
四、PAI 深度学习框架
1、TensorFlow
2、Caffe
3、MXNet
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
五、离线模型、在线预测
之前介绍 PAI 机器学习,也介绍了这种模型。在 PAI 中都支持。