阿里云机器学习平台PAI使用简明教程(二)-阿里云开发者社区

开发者社区> taro_秋刀鱼> 正文

阿里云机器学习平台PAI使用简明教程(二)

简介: 前面在阿里云机器学习平台PAI使用简明教程介绍了使用DataStudio在maxcompute中手动导入数据进行PAI Studio模型的搭建、训练及在线部署调用。实际在使用过程中使用者的数据可能在其它的数据源,目前PAI Studio并不支持直接接入第三方数据源。官方推荐的方式是使用Dataworks的数据集成功能,将数据通过离线同步将数据导入到maxcompute中,然后进行后续操作。本文以Mysql数据库为例,结合GBDT二分类算法组件,演示相关过程的操作流程。
+关注继续查看

Step By Step


1、Dataworks 数据集成
  • 1.1 配置数据源

_

_

白名单
目前支持的数据源

  • 1.2 Mysql数据库表
/*------- CREATE SQL---------*/
CREATE TABLE `paitable` (
  `f0` double DEFAULT NULL,
  `f1` double DEFAULT NULL,
  `f2` double DEFAULT NULL,
  `f3` double DEFAULT NULL,
  `label` bigint(20) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8
INSERT INTO `paitable` VALUES(1,0,0,0,0);
INSERT INTO `paitable` VALUES(0,1,0,0,0);
INSERT INTO `paitable` VALUES(0,0,1,0,1);
INSERT INTO `paitable` VALUES(0,0,0,1,1);
INSERT INTO `paitable` VALUES(1,0,0,0,0);
INSERT INTO `paitable` VALUES(0,1,0,0,0);

SELECT * FROM paitable;

_

  • 1.3 maxcompute数据表
drop table if exists dual;
create table dual (f0 DOUBLE ,f1 DOUBLE ,f2 DOUBLE ,f3 DOUBLE,label BIGINT);

特别提示 特别提示 特别提示

目前因为PAI Studio兼容的数据类型有限,所以在maxcompute中建表的数据类型只能是如下几种:
bigint
double
decimal
boolean
datatime
string
本身maxcompute支持的数据类型很多,如果表中字段包含了其它类型,在PAI Studio 读数据表组件查询不到相关的表。

1.4 配置离线同步

_

_

_

1.5 离线同步

_

2020-02-29 13:00:13.384 [job-226408512] INFO  JobContainer -
任务启动时刻                    : 2020-02-29 12:59:49
任务结束时刻                    : 2020-02-29 13:00:13
任务总计耗时                    :                 24s
任务平均流量                    :                1B/s
记录写入速度                    :              0rec/s
读出记录总数                    :                   6
读写失败总数                    :                   0

_


2 PAI Studio GBDT二分类组件使用

2.1 模块搭建及参数配置

_

_

_

_

2.2 训练及结果查看

_

_

_

参考链接

GBDT二分类
阿里云机器学习平台PAI使用简明教程

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
小记基于xstate实现携程金服业务流程动态化
小记基于xstate实现携程金服业务流程动态化
2 0
场景体验报告——冬季实战营第一期
冬季实战营第一期,通过六个场景,从ECS的登录开始,涵盖了安装并配置Apache、MySQL、PHP环境,Docker的部署、SpringBoot项目的部署,最后还搭建了一个门户网站。
6 0
Spring Boot 基础教程:配置详解
本文主要对 Spring Boot 项目中的配置文件进行了简单的介绍,并学习如何自定义属性并配置多环境项目,最后则是对比了当前主流的两种方式不同格式配置文件 yml 和 properties 的异同。
1 0
【在家实践】 ECS 初体验
第一次体验云服务器,感觉十分奇妙。
5 0
冬季实战营学习报告 第一期:从零到一上手玩转云服务器
这一期训练营从1月17号开始,为期5天。主要内容是了解学习阿里云的云服务(ECS) 因为提前加入了阿里云社区活动群,管理员每天都会提醒我们登录账号打卡学习,这里感谢管理员对我们的监督😊😊。
10 0
基于阿里云服务器安装Docker完整图文教程
基于阿里云服务器安装Docker完整图文教程
6 0
课程内容介绍(1)| 学习笔记
快速学习课程内容介绍(1)
4 0
课程内容介绍 | 学习笔记
快速学习课程内容介绍
9 0
其他学习算法| 学习笔记
快速学习其他学习算法
6 0
宝塔面板如何为网站配置SSL证书?
原文链接:https://blog.csdn.net/JunyouYH/article/details/120734870(我的不属于转载) 代码复制不过来请转原文。。代码复制不过来请转原文。。代码复制不过来请转原文
7 0
+关注
taro_秋刀鱼
博客园主页:https://home.cnblogs.com/u/taro/
232
文章
9
问答
来源圈子
更多
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载