阿里云机器学习平台PAI使用简明教程(一)

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 阿里云机器学习平台是构建在阿里云MaxCompute(原ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。很多用户在初次使用PAI过程中因为对平台比较陌生,总是会遇到这样或那样的困惑。本文以通用的机器学习流程为指导,结合PAI平台逐一介绍数据准备、模型搭建与训练、模型部署与调用,将目前PAI平台的主要操作流程做一个梳理。本文的主要目的是做PAI平台使用流程的演示,所以算法上选择最简单的线性回归算法,便于用户的理解和操作。

操作

数据准备


1、DataStudio中创建数据表

_

  • SQL脚本
CREATE TABLE `lm_test_input` (
    `value` bigint,
    `output1` bigint
) ;

2、数据导入

目前支持多种方式将数据导入到表,如果是大数据量导入,请使用 tunnel客户端工具导入数据到表中。本示例使用的数据量较少,直接通过SQL脚本的方式导入数据。
  • SQL脚本
INSERT into table lm_test_input values (1,2);

INSERT into table lm_test_input values (2,4);

INSERT into table lm_test_input values (3,6);

INSERT into table lm_test_input values (4,8);

INSERT into table lm_test_input values (5,10);

select * from lm_test_input; --查看导入的数据

3、数据表
_


模型搭建与训练


1、新建空表实验

_

2、拖入组件“源/目标的”读数据表模块,配置:
_

3、拖入组件“工具”SQL脚本模块,用于读入数据:
_

4、拖入组件“数据预处理”拆分模块,用于将原数据集拆分为训练集和测试集:
_

5、拖入组件“机器学习”线性回归模块,分别指定特征及标签,用于训练模型:
_

6、拖入组件“机器学习”预测模块,用于预测测试集的情况:
_

7、整个流程:
_

8、点击运行按钮运行整个模型,当然也可以点击到具体的模块选择运行到此处,还可以分别查询各个模块的运行结果:

_

9、运行的结果:

_


模型的部署与调用

机器学习模型在线部署功能可以将您的模型一键部署为Restful API,您可以通过HTTP请求的方式进行调用。

1、部署模型

注意: 模型正常运行后才能部署,并不是搭建的实验都能生成模型,普通的数值处理不能生成模型,常见的可以生成模型算法包括:GBDT二分类、线性支持向量机、逻辑回归二分类、逻辑回归多分类、随机森林、KMeans、线性回归、GBDT回归(GBDT回归算法不支持int型数据格式输入,所以在部署前请注意GBDT算法输入应为Double型)、Tensorflow等。

_

2、Rest调用的参数
_

3、在线调试

_

4、程序调用(value:100)

实例Demo下载 地址

_

5、监控

_

6、目前直接测试API功能默认分配的是二级域名,二级域名仅供测试使用,有每天1000次的访问限制。如果您有更大需求,请在分组管理界面单击绑定域名,对该API所在的分组进行域名绑定。


更多参考

什么是阿里云机器学习

机器学习

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
1月前
|
机器学习/深度学习 测试技术
阿里云入选Gartner数据科学和机器学习平台挑战者象限
Gartner® 正式发布了《数据科学与机器学习平台魔力象限》报告(Magic Quadrant™ for Data Science and Machine Learning Platforms),阿里云成为唯一一家入选该报告的中国厂商,被评为“挑战者”(Challengers)。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
20天前
|
机器学习/深度学习 人工智能 自然语言处理
【EMNLP2024】阿里云人工智能平台 PAI 多篇论文入选 EMNLP2024
阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。
|
1月前
|
JSON 测试技术 API
阿里云PAI-Stable Diffusion开源代码浅析之(二)我的png info怎么有乱码
阿里云PAI-Stable Diffusion开源代码浅析之(二)我的png info怎么有乱码
|
2月前
|
机器学习/深度学习 算法 数据挖掘
从菜鸟到大师:Scikit-learn库实战教程,模型训练、评估、选择一网打尽!
【9月更文挑战第13天】在数据科学与机器学习领域,Scikit-learn是不可或缺的工具。本文通过问答形式,指导初学者从零开始使用Scikit-learn进行模型训练、评估与选择。首先介绍了如何安装库、预处理数据并训练模型;接着展示了如何利用多种评估指标确保模型性能;最后通过GridSearchCV演示了系统化的参数调优方法。通过这些实战技巧,帮助读者逐步成长为熟练的数据科学家。
112 3
|
3月前
|
机器学习/深度学习 数据采集 人工智能
【机器学习】klearn基础教程
scikit-learn(通常缩写为sklearn)是一个用于Python编程语言的强大机器学习库。它提供了各种分类、回归、聚类算法,以及数据预处理、降维和模型评估的工具。以下是sklearn的基础教程,帮助你开始使用它
27 3
|
3月前
|
机器学习/深度学习 存储 人工智能
【ACL2024】阿里云人工智能平台PAI多篇论文入选ACL2024
近期,阿里云人工智能平台PAI的多篇论文在ACL2024上入选。论文成果是阿里云与阿里集团安全部、华南理工大学金连文教授团队、华东师范大学何晓丰教授团队共同研发。ACL(国际计算语言学年会)是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台PAI在自然语言处理和多模态算法、算法框架能力方面研究获得了学术界认可。
|
4月前
|
数据采集 人工智能 自然语言处理
阿里云百炼平台深度体验:智能问答与模型训练的创新之旅
在人工智能的浪潮中,阿里云百炼平台以其强大的大模型开发能力,为企业和个人开发者提供了一站式的解决方案。本文将从知识检索应用搭建、模型训练调优以及流程管理功能三个角度,全面评测阿里云百炼平台的实际使用体验。
310 3
|
4月前
|
JSON Shell API
阿里云PAI-Stable Diffusion开源代码浅析之(一)所有api的入参如何看
阿里云PAI-Stable Diffusion开源代码浅析之所有api的入参如何看
|
3月前
|
机器学习/深度学习 存储 缓存
Java本地高性能缓存实践问题之阿里云机器学习团队开源社区的问题如何解决
Java本地高性能缓存实践问题之阿里云机器学习团队开源社区的问题如何解决

热门文章

最新文章

下一篇
无影云桌面