开发者学堂课程【机器学习实战:开通 PAI 服务及准备数据】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/530/detail/7139
开通 PAI 服务及准备数据
登录使用阿里云机器学习 PAI
1、打开浏览器,最好是 crium, 因为存在不同浏览器之间的一个兼容问题。
在地址栏中输入 ww.aliyun.com,进入阿里云官网的首页。
2、点击控制台右上方的控制按钮,弹出一个登录按钮,输入账号跟密码进行登录。
登录成功之后就进入了阿里云的控制台。
左侧导航栏中有个大数据(数加),要使用的产品都在这个里面。如果是新创建的项目,在里面可能没有那么多项目。可以通过下图中的产品与服务按钮找到你所需要的产品
之前介绍中提到机器学习 PAI 适合阿里云服务 MA,跟大数据阿里云是绑定到一块的,而 Dataworks 就是使用 makesquite 的一个入口,
3、点击 Dataworks
上图中已经创建了一系列项目,点击创建项目,注意因为产品的更新迭代,用户看到的页面可能跟显示的画面有点区别,这个是没关系的,基本的东西都是一致的,只需要稍加熟悉就可以了。
4、点击创建项目,如下图所示,选择区域,选择计算引擎服务,选择MaxCompute, 选择按量付费,讯在机器学习按量付费,假如是第一次进入,按量付费之后有一个去购买,或者去沟通,需要点击那个去购买或者去沟通,返回之后才能选择按量付费,点击机器学习 pai,最下面是 Datawork 服务。
还可以选择数据集成,数据集成就是将其他数据通过 MaxCompute 加载到 Datawork 中。
点击下一步,填写项目名称,PAI-DEMO,显示名称为机器学习 PAI 演示项目,高级设置中都选择打开,Quota 组切换选择按量付费默认资源组,面向 pai 中,如果要使用当前的 pai 项目进行深度学习就需要打开 GPU,如果不需要则直接点击创建项目。
因为有重名,所以修改下名字,该为 PAI-DEMO-NEW, 点击创建项目。
创建完成之后,进入项目列表,
可以查看到新创建的项目正在初始化中,因为之前创建的 PAI-DEMO 为全局唯一的名字,所以一旦被占用就不可以使用这个项目名称来创建项目了。
刷新列表,查看到项目名称已经是正常的了。就创建了一个新项目,并且通过 MaxCompute 的这个服务,也创建了一个新的服务,然后进入这个项目中,将后期需要分析使用的数据先上传上去。
点击进入工作区,以下就是阿里云大数据 MaxCompute 项目开发运营的一个环境。
点击新建脚本,文件名称为 test,类型为 ODPS SQL, 会在其中写 sql 然后与MaxCompute 形成一个交互。
建表,
create table iris (Sepal_length double,sepal_width double,petal_length double,petal_width double,species string)
执行一下建表的语句,点击运行,这个时候执行的sql是在中,MaxCompute 是一个进行数据存储,服务的一个产品。
查看表是否存在,desc iris
查看所使用的数据集,其中包含了 150 条记录,其中包括花的一些基本数据,就是用这个数据集进行一些基本的统计分析,
返回 datawork 中,点击导入,将文件导入到 MaxCompute 中,点击导入,导入本地数据,找到 iris 文件点击进入。
然后通过上面页面将数据加载到 MaxCompute 中,分割符号:逗号,原始字符集:GBK,导入起始行:1,首行为标题选择是,然后点击下一步,
导入到表 iris 中,可以看到目标字段和原字段,点击上传,查看到文件上传已经结束。
检查是否上传,select*from iris,点击运行,这个时候就会到 MaxCompute 查 iris 中的记录状况,可以看到数据上传成功