《交互式分析六脉神剑》之Dataworks-HoloStudio初体验

本文涉及的产品
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: HoloStudio是基于交互式分析的一站式开发平台,深度集成于DataWorks,除了提供可视化UI一键建表外,还支持纯SQL语言编写,也提供终端功能,像使用psql客户端一样使用HoloStudio来开发交互式分析,方便快捷,灵活巧妙,满足不同用户的不同开发习惯。

大家好,今天为大家带来《交互式分析六脉神剑》第二剑商阳剑之HoloStudio,第一剑少商剑传送门:5分钟学会交互式分析?!
金庸武侠中六脉神剑中的商阳剑是指右手食 指—太阳—小肠经—商阳剑,其特点是巧妙灵活,难以捉摸,正好完美对应DataWorks-HoloStudio。
在使用开发工具(比如psql客户端、JDBC等)连接交互式分析进行数据开发时,有些朋友就会有一些小困惑:
1.我想用更多时间去研究数据背后的意义,不想天天写代码建表写数据,有什么办法能让我不写那么多SQL,解放我的双手吗?
2.我们业务组基于DataWorks开发数据,需要用到数据调度、数据服务等功能,如果使用客户端连接交互式分析进行数据开发,好像不是特别方便。
......
正是基于此,我们自研了HoloStudio开发平台来完美解决以上所有的困惑。

HoloStudio是基于交互式分析的一站式开发平台,深度集成于DataWorks,除了提供可视化UI一键建表外,还支持纯SQL语言编写,也提供终端功能,像使用psql客户端一样就能使用HoloStudio来开发交互式分析,方便快捷,灵活巧妙,满足不同用户的不同开发习惯。更精妙的是,还能直接对接DataWorks的各项功能,如数据集成、数据服务等,无需数据迁移、无需多平台交互,轻轻松松能玩转大数据生态。
下面小编将会为大家系统的介绍HoloStudio的开通以及基本功能使用。

开通

绑定工作空间

在使用HoloStudio之前,需要将实例绑定至DataWorks的工作空间

  • 若已有DataWorks工作空间,单击小扳手--工作空间配置--交互式分析--增加实例,将购买好的实例信息填写进去即可。
    image

  • 若无工作空间,需要在管控台创建工作空间,根据项目情况选择是否同时开通其他计算引擎
    image

HoloStudio初体验

绑定完工作空间后,即可使用HoloStudio进行数据开发了。下面给大家一一介绍HoloStudio各个模块的功能。

# # 1.SQL Console

SQL Console模块提供SQL编辑功能,不同于传统psql客户端的是,在SQL语句编写完之后,支持直接全部语句同时执行,也可以单独执行某条语句,并将执行结果进行可视化,同时也支持运行暂停,代码修改等功能,您只需为代码复杂,执行的事交给SQL Console就行。示例如下:
image

# # 2.PG管理

PG管理主要是帮助大家进行UI可视化建表或者外部表,无需编写SQL,一键就能建表,完美解放双手。
- 内部表
在HoloStudio里创建一张内部表,您只需要输入表的字段,下面会自动生成SQL语句,方便您随时检查对照,同时还支持设置表属性,如行存、列存,指定分区等,只需轻轻一点就能完成建表操作。同时还能对新建的表查看最终的DDL语句以及数据预览。
image

  • 外部表
    交互式分析在底层与MaxCompute无缝打通,直接加速读取MaxCompute的数据。通常的做法是需要在交互式分析中新建一张外部表来查询MaxCompute表数据,需要保证两张表的字段、数据类型一一对应,若使用SQL会大大增加开发时间。
    外部表模块支持一键创建外部表,只需一键搜索出MaxCompute表名(可跨工作空间读取MaxCompute中的表),就能创建出与之字段一一对应的外部表。同步字段可根据查询要求进行选择。创建外部表成功后,只需点击数据预览,就能实时查看MaxCompute中的数据,秒级交互式响应。
    image

# # 3.数据开发

数据开发模块主要与DataWorks调度模块打通,能实现经过交互式分析加速查询处理的数据周期性调度。
如何使用HoloStudio实现周期性调度请参见示例

# # 4.终端

当业务变得越来越复杂时,数据量也会越来越多,相应的查询不仅在量上会增加,也会进行更多表的join也会变得复杂,为快速提升查询要求,HoloStudio特提供终端模块。终端可理解为封装后的psql客户端,只要您会使用sql语言,就能使用终端进行开发,实现数据的秒级交互式响应。
image

今天的HoloStudio初体验就介绍到这里了,学习完以上所有操作步骤,相信大家已经对HoloStudio有了初步的了解,也了解到了HoloStudio的灵活巧妙之处,现在开始使用HoloStudio,相信你的头发掉的频率也会减少哦。可关于HoloStudio难以琢磨怎么理解呢?那就不得不说,HoloStudio还支持更多神秘的功能,请大家搓搓小手期待下期内容吧!

在使用过程若大家有任何问题,欢迎随时进群开撩哦!
image

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
传感器
多传感器感知原理解读 | BEVFusion解读(二)
多传感器感知原理解读 | BEVFusion解读(二)
825 0
|
SQL 分布式计算 Unix
阿里云-DataWorks- ODPS SQL开发3-日期与字符、数学运算、聚合函数函数
阿里云-DataWorks- ODPS SQL开发3 本文主要讲解日常大量会接触到的一些常用的日期与字符、数学运算、聚合函数函数。
|
SQL 监控 关系型数据库
MySQL优化: CPU高 处理脚本 pt-kill脚本
MySQL优化: CPU高 处理脚本 pt-kill脚本
|
异构计算
CCF推荐B类会议和期刊总结:(计算机体系结构/并行与分布计算/存储系统领域)
中国计算机学会(CCF)定期发布国际学术会议和期刊目录,为科研人员提供参考。本文总结了计算机体系结构、并行与分布计算、存储系统领域的CCF推荐B类会议和期刊,包括会议和期刊的全称、出版社、dblp文献网址及领域分类。会议涵盖了SoCC、SPAA、PODC等26项重要国际会议,期刊则包括TAAS、TODAES、TECS等9种权威期刊,为相关领域的研究者提供了宝贵的资源。
CCF推荐B类会议和期刊总结:(计算机体系结构/并行与分布计算/存储系统领域)
|
数据采集 监控 大数据
大数据时代的数据质量与数据治理策略
在大数据时代,高质量数据对驱动企业决策和创新至关重要。然而,数据量的爆炸式增长带来了数据质量挑战,如准确性、完整性和时效性问题。本文探讨了数据质量的定义、重要性及评估方法,并提出数据治理策略,包括建立治理体系、数据质量管理流程和生命周期管理。通过使用Apache Nifi等工具进行数据质量监控和问题修复,结合元数据管理和数据集成工具,企业可以提升数据质量,释放数据价值。数据治理需要全员参与和持续优化,以应对数据质量挑战并推动企业发展。
2990 3
|
机器学习/深度学习 数据采集 自然语言处理
使用Python实现深度学习模型:智能社交媒体内容分析
使用Python实现深度学习模型:智能社交媒体内容分析
1019 69
|
12月前
阿里云国际版提交工单后需要多久才能解决问题
阿里云国际版提交工单后需要多久才能解决问题
|
JavaScript 小程序 Java
养老院|基于Springboot的养老院管理系统设计与实现(源码+数据库+文档)
养老院|基于Springboot的养老院管理系统设计与实现(源码+数据库+文档)
792 1
|
SQL 数据采集 存储
Hive实战 —— 电商数据分析(全流程详解 真实数据)
关于基于小型数据的Hive数仓构建实战,目的是通过分析某零售企业的门店数据来进行业务洞察。内容涵盖了数据清洗、数据分析和Hive表的创建。项目需求包括客户画像、消费统计、资源利用率、特征人群定位和数据可视化。数据源包括Customer、Transaction、Store和Review四张表,涉及多个维度的聚合和分析,如按性别、国家统计客户、按时间段计算总收入等。项目执行需先下载数据和配置Zeppelin环境,然后通过Hive进行数据清洗、建表和分析。在建表过程中,涉及ODS、DWD、DWT、DWS和DM五层,每层都有其特定的任务和粒度。最后,通过Hive SQL进行各种业务指标的计算和分析。
2525 1
Hive实战 —— 电商数据分析(全流程详解 真实数据)
|
JavaScript Java 测试技术
基于SpringBoot+Vue的高校社团管理系统的详细设计和实现(源码+lw+部署文档+讲解等)
基于SpringBoot+Vue的高校社团管理系统的详细设计和实现(源码+lw+部署文档+讲解等)
226 0