PAI的输出
如上图所示为PAI平台的数据输出模块,需要明确的是数据的输入和输出都不是在PAI平台完成的,输入的数据和输出的数据都在MAXCOMPUTE中,PAI平台只是完成计算任务
右键单击以上模块,查看输出数据则能看到输出数据的前100条,复制按钮可以将这100条数据复制并粘贴到本地,但是当输出数据大于100条时,则没有办法在PAI平台内实现
通过DATA WORKS的导出数据至本地的方法
通过DATA WORKS来进行MAXCOMPUTE中资源的管理,查看数据开发界面,可以发现并没有下载到本地的选项而是只有将本地数据上传至MAXCOMPUTE中选项
因此采用手动业务流程的方法,通过添加SQL组件来实现将输出数据下载到本地的操作
标签中选择手动业务流程,可以看到流程节点,向可视化界面中添加一个ODPS SQL节点
打开节点,并编写一条查询输出数据表中所有数据的SQL语句,点击运行,并可以看到输出表格并且在输出表格的下方有下载至本地的按钮,需要特别注意的是,SQL查询需要计算费用,具体费用会在计算前有提示
总结:
1、当输出数据在100条以上时,在PAI平台内无法将输出数据全部下载到本地
2、PAI本身不存储数据,只进行计算
3、DATA WORKS只有本地数据上传导入的入口,而没有单独的将数据下载到本地的入口
4、可以通过手动业务流程来将数据下载到本地
5、添加单个业务流程节点(ODPS SQL)并打开节点写一条查询所有输出数据表的SQL语句
6、运行SQL查询语句费用会在运行前有提示,点击运行则在查询完成后会看到查询结果,下方有将查询结果下载到本地的按钮