数据分析是由 Dataworks 团队推出的一款智能数据快速洞察及可视化报表搭建平台,是Dataworks开发平台的重要组成部分。它走完了用户一站式开发的最后一公里路,从数据集成 -> 数据开发 -> 数据服务 -> 数据分析,使得数据开发者和数据分析者的身份边界逐渐被打破,用户既是数据开发者,又是分析者。
维表 支持用户使用图形化的方式新建MaxCompute生产表、编辑MaxCompute表数据、多人协作修改、表格导出等功能。一键同步你的MaxCompute生产表。
为什么要有维表
想象这样一个场景:数据分析师、运营同学需要手工维护一张线上MaxCompute表。
没有维表时,运营同学找到BI描述需求,BI提给研发同学,研发使用Dataworks编辑Sql语句创建Excel、塞入数据交付给运营。每当数据有变化时,就要重新来一遍该流程。在各个部门业务压力如此大的alibaba,无论是运营、BI还是研发同学都叫苦不迭。
现在有了维表,运营同学只需要自己到数据分析维表工具中新建一张维表,像操作本地Excel一样将要修改的数据保存到Sheet中,便会自动同步数据到MaxCompute的生产表,使大家的工作效率飞速提升~
自从弹内发布以来,维表功能就广受好评。越来越多的数据分析师已经使用维表进行数据维护了。
现在维表在弹外重磅发布,你还在等什么呢,快来试用吧~~~
我们实现了什么
- 同时支持图形化、DDL方式配置维表,除了使用图形化直接新建维表,喜欢敲代码的同学可以导入DDL建表语句快速生成维表~
- 数据一键同步MaxCompute生产环境,在维表Excel中完成数据编辑后保存即可同步MaxCompute线上表。
- 支持导入本地表,同时可以支持用户自定义列映射、分隔符、在线设置编码、追加/覆盖的导入方式。灵活操作导入方案的同时和乱码说拜拜~
- 支持表格导出,在D2使用脚本查询维表内容后,通过WebExcel做数据分析后导入到玄机藏,安全审批后下载到本地。安全又快捷~~~
- 维表开放分享编辑功能,维护维表的过程不再孤单,小伙伴们可以组团进行维表编辑。
下面重点介绍维表使用文档:
图形化/DDL模式创建MaxCompute线上表
图形化生成:
、
DDL模式创建:
其中
- 目标工作空间:维表对应的MaxCompute资源所属的DataWorks工作空间
- 表名:MaxCompute表名,数据分析的维表名与MaxCompute始终保持一致,故仅需确认MaxCompute表名即可
- 表描述:对表的用途、性质等一些补充说明
- 字段:添加MaxCompute的字段,为简化处理,字段类型仅支持String
- 生命周期:表的存储会占用MaxCompute资源,故建议对表设置合理的生命周期,以便资源回收
- 风险知晓:数据分析的MaxCompute表维护在生产环境中,故表的创建者应当对表的创建和后续维护负责
- 导入DDL:使用DDL语句导入表信息
维表是直接创建在MaxCompute中的表,数据分析模块中仅同步数据结构,不保存数据;故需要注意两点:
- 需要开通MaxCompute
- 当前用户需要属于某一个DataWorks工作空间,并且需要相应分析师的权限,通过工作空间使用MaxCompute的资源
- 新建出来的维表属于对应项目空间生产环境,因此第一次使用仍然需要申请字段权限,弹内通过安全卫士,弹外通过数据地图
另,为简化使用,维表的字段类型全部处理为String类型,如需使用其他字段类型,数据分析提供的功能暂不能满足,建议通过DataStudio执行DDL语句来创建维护表。
支持导入本地表
其中
- 原始字符集:上传csv文件本身的字符集,支持GBK、UTF-8两种格式字符集切换
- 分隔符:通常用来自定义指定换行分隔符
- 数据预览:上传csv文件内容预览
- 字段映射:自定义配置字段映射
- 数据追加方式:选择追加/覆盖方式追加数据
维表支持数据导出
透过一个动图查看线上维表如何导出并下载到本地的
维表分享编辑功能
其中
- 分享分为编辑、只读权限,所有成员共享维表Owner的权限,也就意味着一定要做好权限管理哦!