DataWorks数据分析维表,数据分析师的手中利器!

本文涉及的产品
大数据开发治理平台 DataWorks,不限时长
简介: 数据分析是由 Dataworks 团队推出的一款智能数据快速洞察及可视化报表搭建平台,是Dataworks开发平台的重要组成部分。它走完了用户一站式开发的最后一公里路,从数据集成 -> 数据开发 -> 数据服务 -> 数据分析,使得数据开发者和数据分析者的身份边界逐渐被打破,用户既是数据开发者,又是分析者。   维表 支持用户使用图形化的方式新建MaxCompute

数据分析是由 Dataworks 团队推出的一款智能数据快速洞察及可视化报表搭建平台,是Dataworks开发平台的重要组成部分。它走完了用户一站式开发的最后一公里路,从数据集成 -> 数据开发 -> 数据服务 -> 数据分析,使得数据开发者和数据分析者的身份边界逐渐被打破,用户既是数据开发者,又是分析者。

 

维表 支持用户使用图形化的方式新建MaxCompute生产表、编辑MaxCompute表数据、多人协作修改、表格导出等功能。一键同步你的MaxCompute生产表。

 

 

为什么要有维表

想象这样一个场景:数据分析师、运营同学需要手工维护一张线上MaxCompute表。

 

没有维表时,运营同学找到BI描述需求,BI提给研发同学,研发使用Dataworks编辑Sql语句创建Excel、塞入数据交付给运营。每当数据有变化时,就要重新来一遍该流程。在各个部门业务压力如此大的alibaba,无论是运营、BI还是研发同学都叫苦不迭。

 

现在有了维表,运营同学只需要自己到数据分析维表工具中新建一张维表,像操作本地Excel一样将要修改的数据保存到Sheet中,便会自动同步数据到MaxCompute的生产表,使大家的工作效率飞速提升~

 

自从弹内发布以来,维表功能就广受好评。越来越多的数据分析师已经使用维表进行数据维护了。

 

现在维表在弹外重磅发布,你还在等什么呢,快来试用吧~~~

 

我们实现了什么

  • 同时支持图形化、DDL方式配置维表,除了使用图形化直接新建维表,喜欢敲代码的同学可以导入DDL建表语句快速生成维表~
  • 数据一键同步MaxCompute生产环境,在维表Excel中完成数据编辑后保存即可同步MaxCompute线上表。
  • 支持导入本地表,同时可以支持用户自定义列映射、分隔符、在线设置编码、追加/覆盖的导入方式。灵活操作导入方案的同时和乱码说拜拜~
  • 支持表格导出,在D2使用脚本查询维表内容后,通过WebExcel做数据分析后导入到玄机藏,安全审批后下载到本地。安全又快捷~~~
  • 维表开放分享编辑功能,维护维表的过程不再孤单,小伙伴们可以组团进行维表编辑。

 

下面重点介绍维表使用文档:

 

图形化/DDL模式创建MaxCompute线上表

 

图形化生成:

 

DDL模式创建:

 

其中

  • 目标工作空间:维表对应的MaxCompute资源所属的DataWorks工作空间
  • 表名:MaxCompute表名,数据分析的维表名与MaxCompute始终保持一致,故仅需确认MaxCompute表名即可
  • 表描述:对表的用途、性质等一些补充说明
  • 字段:添加MaxCompute的字段,为简化处理,字段类型仅支持String
  • 生命周期:表的存储会占用MaxCompute资源,故建议对表设置合理的生命周期,以便资源回收
  • 风险知晓:数据分析的MaxCompute表维护在生产环境中,故表的创建者应当对表的创建和后续维护负责
  • 导入DDL:使用DDL语句导入表信息

 

维表是直接创建在MaxCompute中的表,数据分析模块中仅同步数据结构,不保存数据;故需要注意两点:

  1. 需要开通MaxCompute
  2. 当前用户需要属于某一个DataWorks工作空间,并且需要相应分析师的权限,通过工作空间使用MaxCompute的资源
  3. 新建出来的维表属于对应项目空间生产环境,因此第一次使用仍然需要申请字段权限,弹内通过安全卫士,弹外通过数据地图

另,为简化使用,维表的字段类型全部处理为String类型,如需使用其他字段类型,数据分析提供的功能暂不能满足,建议通过DataStudio执行DDL语句来创建维护表。

 

支持导入本地表

 

 

其中

  • 原始字符集:上传csv文件本身的字符集,支持GBK、UTF-8两种格式字符集切换
  • 分隔符:通常用来自定义指定换行分隔符
  • 数据预览:上传csv文件内容预览
  • 字段映射:自定义配置字段映射
  • 数据追加方式:选择追加/覆盖方式追加数据

 

维表支持数据导出

透过一个动图查看线上维表如何导出并下载到本地的

 

维表分享编辑功能

 

 

其中

  • 分享分为编辑、只读权限,所有成员共享维表Owner的权限,也就意味着一定要做好权限管理哦!

 

 

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
1月前
|
机器学习/深度学习 存储 人工智能
TableAgent数据分析智能体——数据分析师的大模型
TableAgent数据分析智能体——数据分析师的大模型
|
1月前
|
SQL 分布式计算 数据可视化
数据分析案例-数据分析师岗位招聘信息可视化
数据分析案例-数据分析师岗位招聘信息可视化
82 0
|
12天前
|
SQL 分布式计算 DataWorks
DataWorks操作报错合集之在运行数据分析任务时,底层依赖服务alisa.olap.submitjob出现了异常,如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
SQL 运维 分布式计算
阿里云-DataWorks-数据分析开发到上线运维
本文主要讲解 阿里云-DataWorks- 数据分析开发到上线运维 的思路。 因本文为IT人员以技术视角阐述 日常我们做数据分析的实际开发过程所转化,适合数据分析相关人员阅读。
|
DataWorks 数据挖掘 大数据
《DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季》电子版地址
DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季
95 0
《DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季》电子版地址
|
数据采集 SQL 存储
DataWorks 数据分析介绍及实践 | 学习笔记
快速学习 DataWorks 数据分析介绍及实践,介绍了 DataWorks 数据分析介绍及实践系统机制, 以及在实际应用过程中如何使用。
403 0
DataWorks 数据分析介绍及实践 | 学习笔记
|
SQL 分布式计算 DataWorks
6.DataWorks 数据分析介绍及实践(二)|学习笔记
快速学习6.DataWorks 数据分析介绍及实践
285 0
6.DataWorks 数据分析介绍及实践(二)|学习笔记
|
10天前
|
机器学习/深度学习 数据采集 数据挖掘
如何用Python进行数据分析?
【6月更文挑战第13天】如何用Python进行数据分析?
106 66
|
7天前
|
数据采集 数据可视化 数据挖掘
数据挖掘实战:使用Python进行数据分析与可视化
在大数据时代,Python因其强大库支持和易学性成为数据挖掘的首选语言。本文通过一个电商销售数据案例,演示如何使用Python进行数据预处理(如处理缺失值)、分析(如销售额时间趋势)和可视化(如商品类别销售条形图),揭示数据背后的模式。安装`pandas`, `numpy`, `matplotlib`, `seaborn`后,可以按照提供的代码步骤,从读取CSV到数据探索,体验Python在数据分析中的威力。这只是数据科学的入门,更多高级技术等待发掘。【6月更文挑战第14天】
44 11
|
1天前
|
数据采集 机器学习/深度学习 数据可视化
利用Python和Pandas库构建高效的数据分析流程
在数据驱动的时代,数据分析已成为企业决策的关键环节。本文介绍如何利用Python编程语言及其强大的数据分析库Pandas,构建一套高效且可扩展的数据分析流程。与常规的数据分析流程不同,本文不仅涵盖数据加载、清洗、转换等基础步骤,还强调数据可视化、模型探索与评估等高级分析技巧,并通过实际案例展示如何在Python中实现这些步骤,为数据分析师提供一套完整的数据分析解决方案。

热门文章

最新文章