我是一位开发工程师,我平时工作不涉及数据建设与治理类产品的使用。但是在使用dataphin的使用过程中,我发现其拥有具有数据规范化构建、全链路数据治理、数据资产化及跨平台兼容的作用,使用dataphin开发,上手难度低,提升开发效率,以下是我对使用dataphin的总结测评报告:
1.进入dataphin工作台页面

2.在数据规划板块创建新的数据规划

填写好所有数据类型后即可点击下一步
创建项目,填写MaxCompute的相关信息
3.引入数据
创建管道开发脚本,单击顶部菜单栏的研发,选择dataphin_trail_tutorial项目进入创建脚本管道对话框,填写完所有信息后创建脚本管道
接着创建离线脚本,单击组件库-输入-将本地文件输入组件拖至管道画布中,再单击输出-将MaxCompute输出组件拖至管道画布中,将本地文件输入组件和MaxCompute输出组件进行连接
运行和提交离线单条管道脚本,单击运行按钮后,数据将会同步至dataphin中,运行成功后即可点击页面的提交按钮,提交管道脚本,然后就可以在运维界面单机手动运行任务,手动运行表集成任务
4.进入数据处理阶段
在Dataphin首页,单击顶部菜单栏的研发-开发-选择XX项目-单击表管理-单击创建进入创建物理表对话框

在物理表详情页面,单击右上角的从建表语句引入,输入建表sql,单击解析SQL,勾选字段后,单击添加,最后单击提交,在提交对话框中,单击确定并提交,完成物理表的创建。
新建MAX_COMPUTE_SQL计算任务
依次单击开发-选择项目-单击计算任务-单击创建image图标-单击MAX_COMPUTE_SQL,进入新建MAX_COMPUTE_SQL任务对话框。在对话框输入sql后单机保存,保存后点击预编译,数据运行值,检验代码的合法性。在代码编辑器页面,单击右侧菜单栏的属性,在运行参数和调度依赖区域配置参数,配置完成后,单击确定,其他配置保持系统默认设置。然后单机运行按钮,运行成功后即可单机提交,提交sql的计算任务
5.功能周期任务补数据
依次单击运维-选择dataphin_trail_tutorial项目-单击周期任务-选择过去一年每位顾客的平均折扣任务-单击操作列下的image图标-单击补数据-选择补当前任务进行补数据。
补数据提交后,可以在补数据实例-已提交实例列表查看补数据状态。
验证数据是否正常
在Dataphin首页,单击顶部菜单栏的研发,选择XX项目-单击即席查询-单击创建image图标-单击MAX_COMPUTE_SQL,进入新建即席查询对话框。
在代码编写页面,编写代码并验证数据是否符合预期。
数据分析阶段

在新建Notebook对话框中,填写Notebook名称及相关信息后,单击确定。在数据分析页签,在右上角选择XX项目,并输入sql,运行后,单击分析image图标,X轴选择buyer_id,Y轴选择discount_rate,即可对buyer_discount_rate表进行可视化分析。