DataWorks数据分析维表,数据分析师的手中利器!

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
大数据开发治理平台DataWorks,Serverless资源组抵扣包300CU*H
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 数据分析是由 Dataworks 团队推出的一款智能数据快速洞察及可视化报表搭建平台,是Dataworks开发平台的重要组成部分。它走完了用户一站式开发的最后一公里路,从数据集成 -> 数据开发 -> 数据服务 -> 数据分析,使得数据开发者和数据分析者的身份边界逐渐被打破,用户既是数据开发者,又是分析者。   维表 支持用户使用图形化的方式新建MaxCompute

数据分析是由 Dataworks 团队推出的一款智能数据快速洞察及可视化报表搭建平台,是Dataworks开发平台的重要组成部分。它走完了用户一站式开发的最后一公里路,从数据集成 -> 数据开发 -> 数据服务 -> 数据分析,使得数据开发者和数据分析者的身份边界逐渐被打破,用户既是数据开发者,又是分析者。

 

维表 支持用户使用图形化的方式新建MaxCompute生产表、编辑MaxCompute表数据、多人协作修改、表格导出等功能。一键同步你的MaxCompute生产表。

 

 

为什么要有维表

想象这样一个场景:数据分析师、运营同学需要手工维护一张线上MaxCompute表。

 

没有维表时,运营同学找到BI描述需求,BI提给研发同学,研发使用Dataworks编辑Sql语句创建Excel、塞入数据交付给运营。每当数据有变化时,就要重新来一遍该流程。在各个部门业务压力如此大的alibaba,无论是运营、BI还是研发同学都叫苦不迭。

 

现在有了维表,运营同学只需要自己到数据分析维表工具中新建一张维表,像操作本地Excel一样将要修改的数据保存到Sheet中,便会自动同步数据到MaxCompute的生产表,使大家的工作效率飞速提升~

 

自从弹内发布以来,维表功能就广受好评。越来越多的数据分析师已经使用维表进行数据维护了。

 

现在维表在弹外重磅发布,你还在等什么呢,快来试用吧~~~

 

我们实现了什么

  • 同时支持图形化、DDL方式配置维表,除了使用图形化直接新建维表,喜欢敲代码的同学可以导入DDL建表语句快速生成维表~
  • 数据一键同步MaxCompute生产环境,在维表Excel中完成数据编辑后保存即可同步MaxCompute线上表。
  • 支持导入本地表,同时可以支持用户自定义列映射、分隔符、在线设置编码、追加/覆盖的导入方式。灵活操作导入方案的同时和乱码说拜拜~
  • 支持表格导出,在D2使用脚本查询维表内容后,通过WebExcel做数据分析后导入到玄机藏,安全审批后下载到本地。安全又快捷~~~
  • 维表开放分享编辑功能,维护维表的过程不再孤单,小伙伴们可以组团进行维表编辑。

 

下面重点介绍维表使用文档:

 

图形化/DDL模式创建MaxCompute线上表

 

图形化生成:

 

DDL模式创建:

 

其中

  • 目标工作空间:维表对应的MaxCompute资源所属的DataWorks工作空间
  • 表名:MaxCompute表名,数据分析的维表名与MaxCompute始终保持一致,故仅需确认MaxCompute表名即可
  • 表描述:对表的用途、性质等一些补充说明
  • 字段:添加MaxCompute的字段,为简化处理,字段类型仅支持String
  • 生命周期:表的存储会占用MaxCompute资源,故建议对表设置合理的生命周期,以便资源回收
  • 风险知晓:数据分析的MaxCompute表维护在生产环境中,故表的创建者应当对表的创建和后续维护负责
  • 导入DDL:使用DDL语句导入表信息

 

维表是直接创建在MaxCompute中的表,数据分析模块中仅同步数据结构,不保存数据;故需要注意两点:

  1. 需要开通MaxCompute
  2. 当前用户需要属于某一个DataWorks工作空间,并且需要相应分析师的权限,通过工作空间使用MaxCompute的资源
  3. 新建出来的维表属于对应项目空间生产环境,因此第一次使用仍然需要申请字段权限,弹内通过安全卫士,弹外通过数据地图

另,为简化使用,维表的字段类型全部处理为String类型,如需使用其他字段类型,数据分析提供的功能暂不能满足,建议通过DataStudio执行DDL语句来创建维护表。

 

支持导入本地表

 

 

其中

  • 原始字符集:上传csv文件本身的字符集,支持GBK、UTF-8两种格式字符集切换
  • 分隔符:通常用来自定义指定换行分隔符
  • 数据预览:上传csv文件内容预览
  • 字段映射:自定义配置字段映射
  • 数据追加方式:选择追加/覆盖方式追加数据

 

维表支持数据导出

透过一个动图查看线上维表如何导出并下载到本地的

 

维表分享编辑功能

 

 

其中

  • 分享分为编辑、只读权限,所有成员共享维表Owner的权限,也就意味着一定要做好权限管理哦!

 

 

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
6月前
|
机器学习/深度学习 存储 人工智能
TableAgent数据分析智能体——数据分析师的大模型
TableAgent数据分析智能体——数据分析师的大模型
|
4月前
|
SQL 分布式计算 DataWorks
解锁数据洞察:通过 DataWorks 获得深度数据分析
DataWorks提供了一种全新的数据洞察功能,通过深度数据分析和可视化,为您的业务决策提供有力支持。了解更多如何利用AI技术解析复杂数据。
147 7
解锁数据洞察:通过 DataWorks 获得深度数据分析
|
6月前
|
SQL 分布式计算 数据可视化
数据分析案例-数据分析师岗位招聘信息可视化
数据分析案例-数据分析师岗位招聘信息可视化
132 0
|
3月前
|
运维 DataWorks 安全
DataWorks产品使用合集之只读实例数据库是否可以进行数据分析
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
4月前
|
DataWorks 监控 数据挖掘
DataWorks产品使用合集之数据分析维表有什么用处
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
5月前
|
SQL 分布式计算 DataWorks
DataWorks操作报错合集之在运行数据分析任务时,底层依赖服务alisa.olap.submitjob出现了异常,如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
SQL 运维 分布式计算
阿里云-DataWorks-数据分析开发到上线运维
本文主要讲解 阿里云-DataWorks- 数据分析开发到上线运维 的思路。 因本文为IT人员以技术视角阐述 日常我们做数据分析的实际开发过程所转化,适合数据分析相关人员阅读。
|
3月前
|
DataWorks Kubernetes 大数据
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
|
3月前
|
SQL DataWorks 安全
DataWorks产品使用合集之如何实现分钟级调度
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
3月前
|
运维 DataWorks 监控
DataWorks产品使用合集之如何自定义UDTF
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
下一篇
无影云桌面