数据建设与治理丨Dataphin中如何进行Hologres开发

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 前言:在Dataphin 3.9中新增支持Hologres引擎的适配。Hologres是一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,支持标准SQL(兼容PostgreSQL协议),支持PB级数据多维分析(OLAP)与即席分析(Ad Hoc),支持高并发低延迟的在线数据服务(Serving)。通过Dataphin的研发平台能力以及数据资产治理能力,可提供更好的即席分析及实时数仓的构建能力。

一、支持的场景

以下为Dataphin+Hologres的两个典型场景:

1.      使用Hologres进行高效的分析,提升分析体验与效率

a.      MaxCompute中构建基础公共层,降低数据加工和存储的成本

b.      将加工好的数据通过数据集成或者外表的方式推送到Hologres中,构建集市层用于即席分析或进行调度,提升数据分析的效率和产出效率

c.      Hologres的表可在数据资产目录中展示,并可展示血缘信息,表结构信息及分区信息

d.      通过Dataphin提供的功能进行统一的数据标准的管理、数据标准的落标和稽核,也可配置质量稽核规则,并通过安全的分类分级,进行数据脱敏或加密。

20230518143742.jpg

2.      Dataphin + Hologres构建实时数仓

a.      使用Hologres实时数仓为批流统一的存储层

b.      通过Dataphin的项目绑定Hologres离线计算引擎及阿里云实时计算Flink引擎,可使用Flink,流式读取Hologres源表,并可将Hologres表作为维表进行查询,也可以将数据写入Hologres结果表构建实时数仓

c.      利用Hologres SQL或者Flink SQL批模式构建批链路,可用于回刷及覆盖结果

d.      Hologres的表可在数据资产目录中展示,并可展示血缘信息,表结构信息及分区信息

e.      通过Dataphin提供的功能进行统一的数据标准的管理、数据标准的落标和稽核,也可配置质量稽核规则,并通过安全的分类分级,进行数据脱敏或加密。

22.jpg


二、配置Hologres项目

通过简单的几步,您就可以开始使用Dataphin进行Hologres的研发。

  1. 创建Hologres计算引擎


  1. 绑定Hologres计算引擎


  1. 将数据替同步到Hologres中


  1. 创建Hologres SQL任务,即可开始Hologres的数据查询或数据处理


  1. 查看Hologres表资产


三、支持的功能模块

除了支持基本的Hologres SQL任务外,Dataphin还对Hologres做了以下的能力适配:

●    增强的研发体验

○    支持将外部数据集成到到Hologres项目中,也支持将Hologres项目中的数据导出到其他数据源

○    实时研发支持直接访问Hologres计算源中的物理表

●    统一的资产管理

○    资产目录中可搜索、查看Hologres 计算源的数据资产,查看预览数据,质量 报告,以及Hologres的血缘和产出信息

○    可在Dataphin内进行统一的数据权限管控,支持表及字段级的权限管控


●    资产治理加持,保障数据质量

○    可对Hologres的数据资产进行落标映射及稽核

○    可对Hologres的数据资产进行质量监控

○    可对Hologres的数据资产进行自动分类分级及查询脱敏(仅支持部分脱敏规则)

●    资产服务化

○    配置为Dataphin数据源时可选择Hologres 计算源内的表


四、未来展望

相较于MaxCompute离线数据加工,Hologres的分析及数据加工处理的会更加高效。未来Dataphin也会将Hologres的能力扩展,如将Hologres的表配置为数据服务API,也可将Hologres引擎用于标签生产或标签画像的查看等场景,提升用户体验。



Dataphin.png

瓴羊Dataphin(智能数据建设与治理)是阿里巴巴集团数据治理方法论基于内部实践的产品化输出,致力于帮助企业用中台方法论治理企业级好数据,构建起质量可靠、消费便捷、生产安全经济的企业级数据中台。

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
相关文章
|
1月前
|
人工智能 关系型数据库 MySQL
数据魔力,一触即发 —— Dataphin数据服务API,百炼插件新星降临!
本文通过一个利用百炼大模型平台和Dataphin数据服务API构建一个客户360智能应用的案例,介绍如何使用Dataphin数据服务API在百炼平台创建一个自定义插件,用于智能应用的开发,提升企业智能化应用水平。
128 3
数据魔力,一触即发 —— Dataphin数据服务API,百炼插件新星降临!
|
1月前
|
安全 Java 数据库连接
Dataphin的数据共享的应用场景和方案
不同的业务场景对数据访问和使用有着各自独特的需求,从简单的数据下载到复杂的跨系统集成,选择合适的数据共享与访问方式至关重要。本文旨在探讨几种常见的Dataphin上的数据共享与访问机制——包括数据复制、数据下载、视图创建、行级及列级权限控制、API数据服务以及JDBC连接等,并分析它们各自的适用场景、优势及限制,以帮助企业更好地根据自身需求做出合理的选择。
|
2月前
|
数据处理 调度
Dataphin功能Tips系列(26)-事实逻辑表配置数据延迟
零售行业中,订单数据是每天晚上由pos系统同步至数据中台,但门店人员经常会没有及时将订单信息录入pos,也许隔天或是隔几天才录入,这会导致指标的不准确性,数据中台的开发人员往往需要进行批量补历史分区的数据,这时怎么才能减轻开发人员的工作,让系统能够自动补前几天分区中的事实逻辑表中的数据呢?
|
3月前
|
存储 安全 网络安全
Hologres 的安全性和数据隐私保护
【9月更文第1天】随着数据量的不断增长和对数据价值的认识加深,数据安全和隐私保护成为了企业和组织不可忽视的重要议题。Hologres 作为一款高性能的实时数仓产品,在设计之初就将安全性置于核心地位。本文将深入探讨 Hologres 在保障数据安全和隐私方面的措施,包括数据加密、访问控制以及如何满足各类数据保护法规的要求。
70 3
|
3月前
|
消息中间件 Java 数据库连接
Hologres 数据导入与导出的最佳实践
【9月更文第1天】Hologres 是一款高性能的实时数仓服务,旨在提供快速的数据分析能力。无论是从外部数据源导入数据还是将数据导出至其他系统,都需要确保过程既高效又可靠。本文将详细介绍如何有效地导入数据到 Hologres 中,以及如何从 Hologres 导出数据。
130 1
|
4月前
|
SQL DataWorks 数据库连接
实时数仓 Hologres操作报错合集之如何将物理表数据写入临时表
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
4月前
|
SQL 消息中间件 OLAP
OneSQL OLAP实践问题之实时数仓中数据的分层如何解决
OneSQL OLAP实践问题之实时数仓中数据的分层如何解决
65 1
|
4月前
|
SQL 分布式计算 关系型数据库
实时数仓 Hologres操作报错合集之指定主键更新模式报错主键数据重复,该如何处理
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
4月前
|
SQL JSON 分布式计算
DataWorks操作报错合集之如何解决在创建Hologres开发节点时报错
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
4月前
|
SQL DataWorks 安全
DataWorks产品使用合集之怎么将数据导入或写入到 Hologres
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

相关产品

  • 智能数据建设与治理 Dataphin