前沿分享|数澜科技联合创始人&副总裁 江敏:基于云原生数据仓库AnalyticDB PostgreSQL的最佳实践

简介: 本篇内容为2021云栖大会-云原生数据仓库AnalyticDB技术与实践峰会分论坛中,数澜科技联合创始人&副总裁江敏关于“基于云原生数据仓库AnalyticDB PostgreSQL的最佳实践”的分享。

3a51ad200ad744a6a8894d9195cf7d12.jpeg

本篇内容将通过四个部分来介绍基于云原生数据仓库AnalyticDB PG的最佳实践。

一、背景介绍

二、方案介绍

三、客户实践—某商业集团

四、公司介绍

 2.png



一、背景介绍


当前我国数据中台行业处于从萌芽转向高速发展的过渡期,伴随着数据星的爆发式增长,数据处理技术的进步,以及企业数字化转型驱动市场需求不断增加,行业增长势头明显,市场规模快速扩张。目前,数据中台在行业头部已逐渐薄地,而对于数据中台能力要求相对简单的中小企业,为其提供标准化、轻量化的整体解决方案将是日前市场的主要诉求。

3.png



我们去构建整个数据中台的能力的时候,其实会碰到一些问题。比如,底层架构复杂。传统数据中台架构思维,导致客户在选型和部署大数据组件,开发和调度数据任务和运维和运营数据需要多方进行权衡考虑,架构复杂,使用门槛过高。其次,运维成本高。伴随着传统統数据中台底层架构的复杂性,随之而来的是复杂的IT人员体系以及高昂的运维成本。第三,响应时效挑战大。随着数据量的不断增加以及业务需求的不断迭代,如何快速响应业务人员需求、减少数据分析的等待时间、让业务人员有更好的体验将成为数据中台成功的关键指标。


4.png


二、方案介绍

5.png



我们基于ADB PG这个版本去构建整个轻量级数据中台的时候,你会发现底下就一个ADB PG。中间的话,我们是一个轻量级数据中台的套件。这样两套系统就可以去撑我们上层的业务建设。

6.png


从整个的业务架构来说,底层是我们现有的各种数据源的系统。然后我们会在数据中台会搭建一个技术体系,在技术体系里包括了ADB。之后再构建我们整个的数据体系跟服务体系。在数据中台的技术体系上,就是我们的数据流。它会经过一个数据建模的过程。对于轻量化的中小微企业来说,当需要轻量化的方案时,我们会把它放到ADB里。在这过程中,就不需要去考虑搬迁数据的问题,我所有的数据都在这个体系里面。ADB的数据量,其实能够支撑大部分企业的数据量使用。

7.png



企业只要在这里构建整个数据模型,我们会有相应的工具来支撑,包括数据同步,环境管理,模型开发,模型监测,包括数据治理的一些功能。对于数据及服务来说,我们在构建数据模型的时候,针对企业的对象,我们会去构建一些具体的指标,相应的内幕体系也会建设起来。比如,我们从客户的视角,构建客户的画像体系。从供应商的视角,构建供应商的画像体系。数据构建完之后,我们就可以去做洞察,营销,精准匹配等。所以从数据层面看,它能够支撑应用场景。

8.png



针对具体的场景来看,我们分成几大块。第一个,财务领域。财务报表有时候会跟企业的经营报表口径统一,大部分企业在面临财务审计的时候,对于企业来说是一个非常强的需求。第二个,企业的应收应付和人力资源的管理。对员工的洞察,也需要通过数字化的手段去管理员工叫数字员工。更加精细化的去对员工做一些考核,包括一些相应的指标分析。第三,我们目前在一些领域做实时数据的分析。根据轨迹去做态势的分析,包括一些碰撞的分析。第四,加密数据库的能力。这种场景可以基于ADB的底座去构建。数据的可用不可见,让我们对数据可以更加高效的管理。

9.png



三、客户实践—某商业集团


我们主要讲一个商业集团的案例。这个商业集团,主要是管理高速服务区。原先服务区,每个服务区自己建设系统。现在随着智能化服务区概念的提出,需要对进出服务区的管理进行统一。在建设之初,我们也遇到了一些问题。比如,数据收集难,50对+服务区,各自独立,只能收集部分统计数据;多种信息系统独自建设,归口各不统一;无法有效获得周边路段的数据;数据孤岛问题明显。数据管理混乱,各位数据笆理部门不一,没有形成统一的资产目录; 数据标准不一,数据质参差不齐;跨部门数据使用协调繁琐。数据使用弱,数据大部分处于沉唾状态。对于管理者的运营监控、经营决策等方面缺少必要的智能洞察。


在解决这些问题的时候,要考虑到对于各个服务区的这个站点,怎样能够降低维护成本?怎样可以开箱即用?,对于它里面建设场景刚才其实也简单介绍过。第一个,服务器里会有很多视频分析的场景。涉及到关键信息,要实时抓取,写到道数据库里。比如人流的情况,车流的情况,拥堵的这种情况,人员进来之后,对什么样的商品有需求?对于服务区总体的管控来说,我们在预测服务区的流量,一些供需关系,一些管理的时候。它需要把数据汇聚到总部来,做统一的管理,统一的分析。


10.png


从客户价值呈现的角度来说,第一,智能化。我们通过对各类数据的采集、加工、治理及应用,并结合成熟的业务模型,释放数据价值,支撑业务的智能化。第二,轻量化。我们简化传统中台架构,用ADB替代Hadoop生态,降低企业资源存储及计算的复杂度和成本;为多维分析决策提供保障。第三,场景化。我们以具体的业务场最为切入点,自下而上,围绕场景开展数据治理,构建数据资产,支撑数据应用需求,贴近价值。

11.png



四、公司介绍


数澜科技成立于2016年6月,自成立之日起,秉持”让数据用起来”的使命,帮助企业持续数据资产化,赋能业务创新。数澜科技总部位于杭州,在华北(北京)、华南(深圳)、华西(成都)、华中(武汉)设有本地化团队,核心成员均来自阿里巴巴、华为、IBM、 百度、金蝶、甲骨文等一线企业,是国内较早-批大数据服务创新实践者。截止目前,数澜科技使用旗下核心产品”数栖平台”, 已为1000+企业客户提供数据中台建设服务,帮助客窖户使用数据中台作为关键数字技术推动企业的数字化变革。

相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
目录
相关文章
|
1月前
|
SQL 存储 大数据
数据仓库(10)数仓拉链表开发实例
拉链表是数据仓库中特别重要的一种方式,它可以保留数据历史变化的过程,这里分享一下拉链表具体的开发过程。 维护历史状态,以及最新状态数据的一种表,拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部分不变的记录,通过拉链表可以很方便的还原出拉链时点的客户记录。
166 13
数据仓库(10)数仓拉链表开发实例
|
3月前
|
SQL 关系型数据库 MySQL
在云数据仓库AnalyticDB MySQL版中,有几个参数可能影响SELECT查询的执行及其稳定性
在云数据仓库AnalyticDB MySQL版中,有几个参数可能影响SELECT查询的执行及其稳定性【1月更文挑战第16天】【1月更文挑战第80篇】
290 4
|
3月前
|
SQL 运维 关系型数据库
基于AnalyticDB PostgreSQL的实时物化视图研发实践
AnalyticDB PostgreSQL企业数据智能平台是构建数据智能的全流程平台,提供可视化实时任务开发 + 实时数据洞察,让您轻松平移离线任务,使用SQL和简单配置即可完成整个实时数仓的搭建。
367 1
|
3月前
|
SQL canal 算法
PolarDB-X最佳实践:如何设计一张订单表
本文主要内容是如何使用全局索引与CO_HASH分区算法(CO_HASH),实现高效的多维度查询。
|
1月前
|
分布式计算 大数据 Hadoop
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一下,希望能帮助到大家。建议收藏起来,后续有新的书籍清单会更新到这里。
162 2
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
|
1月前
|
SQL 数据采集 存储
数据仓库(12)数据治理之数仓数据管理实践心得
这边文章聊聊自己对数据治理开发实践的一些思路,就是聊聊怎么开始去做数据治理这件事情。说起数据治理,有时候虽然看了很多文章,看了很多的介绍,了解数据治理的理论,但是实际上需要我们去搞的时候,就会踩很多的坑。这里记一下自己做数据治理的一些思路,做做笔记,也分享给需要的同学。 当然,想要做数据治理,想要学习了解,一下数据治理的范围,理论等,最好可以看看别人怎么做的,了解数据治理可以参考:[数据仓库(11)什么是大数据治理,数据治理的范围是哪些](https://zhuanlan.zhihu.com/p/467433967)。
234 0
|
1月前
|
存储 大数据 数据管理
数据仓库(09)数仓缓慢变化维度数据的处理
数据仓库的重要特点之一是反映历史变化,所以如何处理维度的变化是维度设计的重要工作之一。缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流逝发生缓慢的变化,与数据增长较为快速的事实表相比,维度变化相对缓慢。阴齿这个就叫做缓慢变化维。
211 2
数据仓库(09)数仓缓慢变化维度数据的处理
|
1月前
|
SQL Cloud Native 关系型数据库
AnalyticDB MySQL湖仓版是一个云原生数据仓库
【2月更文挑战第15天】AnalyticDB MySQL湖仓版是一个云原生数据仓库
24 2
|
3月前
|
SQL 分布式计算 Java
数仓学习---7、数据仓库设计、数据仓库环境准备、模拟数据生成
数仓学习---7、数据仓库设计、数据仓库环境准备
126 2
|
3月前
|
数据挖掘 数据库
离线数仓6.0--- 数据仓库 ER模型-范式理论,维度模型、维度建模理论之事实表、维度建模理论之维度表
离线数仓6.0--- 数据仓库 ER模型-范式理论,维度模型、维度建模理论之事实表、维度建模理论之维度表
120 0

热门文章

最新文章

相关产品

  • 云原生数据仓库AnalyticDB MySQL版
  • 云原生数据仓库 AnalyticDB PostgreSQL版