《交互式分析六脉神剑》之Dataworks-HoloStudio初体验

本文涉及的产品
大数据开发治理平台DataWorks,Serverless资源组抵扣包300CU*H
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: HoloStudio是基于交互式分析的一站式开发平台,深度集成于DataWorks,除了提供可视化UI一键建表外,还支持纯SQL语言编写,也提供终端功能,像使用psql客户端一样使用HoloStudio来开发交互式分析,方便快捷,灵活巧妙,满足不同用户的不同开发习惯。

大家好,今天为大家带来《交互式分析六脉神剑》第二剑商阳剑之HoloStudio,第一剑少商剑传送门:5分钟学会交互式分析?!
金庸武侠中六脉神剑中的商阳剑是指右手食 指—太阳—小肠经—商阳剑,其特点是巧妙灵活,难以捉摸,正好完美对应DataWorks-HoloStudio。
在使用开发工具(比如psql客户端、JDBC等)连接交互式分析进行数据开发时,有些朋友就会有一些小困惑:
1.我想用更多时间去研究数据背后的意义,不想天天写代码建表写数据,有什么办法能让我不写那么多SQL,解放我的双手吗?
2.我们业务组基于DataWorks开发数据,需要用到数据调度、数据服务等功能,如果使用客户端连接交互式分析进行数据开发,好像不是特别方便。
......
正是基于此,我们自研了HoloStudio开发平台来完美解决以上所有的困惑。

HoloStudio是基于交互式分析的一站式开发平台,深度集成于DataWorks,除了提供可视化UI一键建表外,还支持纯SQL语言编写,也提供终端功能,像使用psql客户端一样就能使用HoloStudio来开发交互式分析,方便快捷,灵活巧妙,满足不同用户的不同开发习惯。更精妙的是,还能直接对接DataWorks的各项功能,如数据集成、数据服务等,无需数据迁移、无需多平台交互,轻轻松松能玩转大数据生态。
下面小编将会为大家系统的介绍HoloStudio的开通以及基本功能使用。

开通

绑定工作空间

在使用HoloStudio之前,需要将实例绑定至DataWorks的工作空间

  • 若已有DataWorks工作空间,单击小扳手--工作空间配置--交互式分析--增加实例,将购买好的实例信息填写进去即可。
    image

  • 若无工作空间,需要在管控台创建工作空间,根据项目情况选择是否同时开通其他计算引擎
    image

HoloStudio初体验

绑定完工作空间后,即可使用HoloStudio进行数据开发了。下面给大家一一介绍HoloStudio各个模块的功能。

# # 1.SQL Console

SQL Console模块提供SQL编辑功能,不同于传统psql客户端的是,在SQL语句编写完之后,支持直接全部语句同时执行,也可以单独执行某条语句,并将执行结果进行可视化,同时也支持运行暂停,代码修改等功能,您只需为代码复杂,执行的事交给SQL Console就行。示例如下:
image

# # 2.PG管理

PG管理主要是帮助大家进行UI可视化建表或者外部表,无需编写SQL,一键就能建表,完美解放双手。
- 内部表
在HoloStudio里创建一张内部表,您只需要输入表的字段,下面会自动生成SQL语句,方便您随时检查对照,同时还支持设置表属性,如行存、列存,指定分区等,只需轻轻一点就能完成建表操作。同时还能对新建的表查看最终的DDL语句以及数据预览。
image

  • 外部表
    交互式分析在底层与MaxCompute无缝打通,直接加速读取MaxCompute的数据。通常的做法是需要在交互式分析中新建一张外部表来查询MaxCompute表数据,需要保证两张表的字段、数据类型一一对应,若使用SQL会大大增加开发时间。
    外部表模块支持一键创建外部表,只需一键搜索出MaxCompute表名(可跨工作空间读取MaxCompute中的表),就能创建出与之字段一一对应的外部表。同步字段可根据查询要求进行选择。创建外部表成功后,只需点击数据预览,就能实时查看MaxCompute中的数据,秒级交互式响应。
    image

# # 3.数据开发

数据开发模块主要与DataWorks调度模块打通,能实现经过交互式分析加速查询处理的数据周期性调度。
如何使用HoloStudio实现周期性调度请参见示例

# # 4.终端

当业务变得越来越复杂时,数据量也会越来越多,相应的查询不仅在量上会增加,也会进行更多表的join也会变得复杂,为快速提升查询要求,HoloStudio特提供终端模块。终端可理解为封装后的psql客户端,只要您会使用sql语言,就能使用终端进行开发,实现数据的秒级交互式响应。
image

今天的HoloStudio初体验就介绍到这里了,学习完以上所有操作步骤,相信大家已经对HoloStudio有了初步的了解,也了解到了HoloStudio的灵活巧妙之处,现在开始使用HoloStudio,相信你的头发掉的频率也会减少哦。可关于HoloStudio难以琢磨怎么理解呢?那就不得不说,HoloStudio还支持更多神秘的功能,请大家搓搓小手期待下期内容吧!

在使用过程若大家有任何问题,欢迎随时进群开撩哦!
image

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
5月前
|
DataWorks 监控 数据挖掘
DataWorks产品使用合集之数据分析维表有什么用处
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
6月前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之有哪些审计功能
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
7月前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之要查看MaxCompute Studio中的项目中的计算任务代码,我该怎么操作
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
数据采集 SQL 存储
6.DataWorks 数据分析介绍及实践(一)|学习笔记
快速学习6.DataWorks 数据分析介绍及实践
6.DataWorks 数据分析介绍及实践(一)|学习笔记
|
SQL 分布式计算 DataWorks
6.DataWorks 数据分析介绍及实践(二)|学习笔记
快速学习6.DataWorks 数据分析介绍及实践
6.DataWorks 数据分析介绍及实践(二)|学习笔记
|
SQL 分布式计算 运维
4.DataWorks 数据开发介绍及实践(二)|学习笔记
快速学习4.DataWorks 数据开发介绍及实践
4.DataWorks 数据开发介绍及实践(二)|学习笔记
|
SQL 数据采集 运维
4.DataWorks 数据开发介绍及实践(一)|学习笔记
快速学习4.DataWorks 数据开发介绍及实践
4.DataWorks 数据开发介绍及实践(一)|学习笔记
|
存储 数据采集 数据可视化
千字干货带你入门数据仓库,跑通数据建模全流程(附视频)
个推资深大数据研发工程师为大家深入浅出地介绍了数据仓库的前世今生以及数据建模的常用方法。
580 0
千字干货带你入门数据仓库,跑通数据建模全流程(附视频)
|
安全 BI 数据安全/隐私保护
【视频特辑】提效神器!如何用Quick BI高效配置员工的用数权限
随着企业数字化进程逐步加速,企业所产生和积累的数据资源日益增多。 每当员工的用数权限发生变动,管理员都需要进行复杂繁琐的重复性配置流程,不仅耗时耗力还容易出错。 如何能便捷地对员工用数权限进行高效管理?试试Quick BI的角色权限管理功能吧!
301 0
【视频特辑】提效神器!如何用Quick BI高效配置员工的用数权限
|
SQL 分布式计算 运维
冬季实战营第五期学习报告1:基于EMR离线数据分析
本实验免费提供EMR集群,基于EMR集群进行离线数据分析。