2022云栖精选—『简单·易用』 一站式数据管理与服务

本文涉及的产品
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
简介: 付大超阿里云数据库事业部资深技术专家DMS和DTS产品部负责人

lQLPJxbcF2cqNBvMiM0FeLCMz4ifcSGHeANpqgFLAEAA_1400_136.png

image.png

市场报告显示2025年将有75%数据库迁移到云上,将有30%数据实时数据,2024年末数据保护法将会保护到 75% 人口。整体趋势可以总结为上云、实时以及安全。

我们认为,库仓一体是未来趋势因为核心数据数据产生,而实现库仓一体化可以降低用户使用成本

image.png

用户开发数据应用时,需要与数据库之间进行交互,比如建表和组件、进行数据库变更操作等。最后通过程序将数据写入到生产库,比如数据库存储系统。基于生产库数据会进行集成与加工比如进行同步,迁移进行 ETL ,然后数据会流向AP系统,在AP系统进行分析之后,数据又向下游动,通过数据服务最终提供给数据应用

这个过程中会产生一系列语言数据和操作行为,操作行为最终会沉淀数据资产。

image.png

上述流程中会存在几个痛点:

第一,规范无法落地。将规范真正有效落地到可度量的产品功能上与书面规范存在非常大差距,并且落地后稳定性问题突出。

第二,集成加工复杂。数据产品非常多,数据要在数据库产品之间或存储之间进行流动,需要一系列技术支撑无论是批量集成还是实时集成,数据流动本身就是很大的问题。并且同时会引起更多的使用成本、运维成本以及诊断成本

第三,个工具使用切换库表设计、传输、加工分析等,它们的购买成本、使用成本、运维成本本身就是对客户的巨大考验。

第四,数据治理困难数据安全保护法难以真正落地,安全合规问题突出

image.png

基于以上痛点,阿里云推出了一站式数据管理与服务DMS

针对规范无法落地问题,我们抽象了数据库DevOps 通过研发系统、访问控制等一系列技术来解决问题,比如研发人员无需获取到数据库用户名和密码,也进行数据库表的设计、开发、变更等一系列流程。

针对集成加工复杂问题,我们推出了数据传输加工,通过集成数据传输迁移同步订阅能力,实现了异构数据库端到端的实时数据传输,并且过程中进行ETL解决了数据自由流动问题。

针对多个工具切换问题,我们抽象出了数据服务应用功能,提供了一键宽表、一键报表、一键API等服务,解决了数据使用的复杂问题。另外,推出了逻辑数仓功能,同时结合ADB引擎,使功能更强大、更易用。

针对数据治理困难我们与达摩院合作实现数据知识构建隐私脱敏计算加密数据库一整套流程建立了事前事中事后方法论,并且将能力沉淀到数据库安全中心,希望能为用户解决安全问题。

image.png

接入层,无论是SQL还是API都可以被集成,调用层支持弹,核心模块层支持Scale Up Scale Out 比如做数据集成时往往速度较慢,单进程无法满足性能要求时,可以为其申请规格。底层的引擎层集成了数据库所有核心产品能力

DMS满分通过了信通院认证,底层DTS引擎从2011 年开始服务于异地多活架构。我们拥有50+自研技术,并且拥有17 项专利沉淀。通过不断从客户问题抽象出场景,最后变产品能力。

image.png

为了避免数据库的数据泄露风险,我们实现了访问控制技术,同时通过授权管理实现了库、表、链甚至行级别的审批和授权。无论是人员入职、离职转岗,都不会发生数据泄露。

数据安全包括敏感数据识别分类、脱敏等。我们通过数据库安全技术,能够做到真正分类分级。我们将数据法内置于该能力中,用户可以直接选择使用。

我们也实现了DTS实时数据解析加工,提供了实时日志解析和迁移的能力。并通过Schema MCC专利技术,保证用户DDL时链路不会出现问题。

通过大量应用积累,我们沉淀了一系列基于数据智能技术。比如通过Schema Matching技术判断两个列之间是否有关系。对敏感列进行加工生成新列之后,新列对应状态基于血缘进行传播解决一系列衍生问题。通过数据机器学习解决数据和报表之间匹配问题,能够自动推荐应该选择什么样报表,并一键生成报表。

DMS一站式能力

胡航丽

阿里云数据库事业部高级产品专家

image.png

在数据库开发过程中,绝大多数公司都会遇到或正在遇到以下问题。比如数据库研发规范只落在纸面,并未实际执行,导致数据库故障一直发生;比如很多数据库上线过程中的SQL优化Review都需要依赖DBA集中执行导致研发效率非常低下;比如企业中很多人员拥有数据库账号和密码,导致数据库泄露。同样的问题在十几年以前已经困扰着阿里巴巴。

因此, 2010 我们自研了DMS,发布大模块DevOps能力,通过400+研发规范全流程变更管控一系列能力有效降低了90%以上的数据库管理成本,并且能够最大限度保证研发的高效率

DevOps2013年在公有云上发布,企业可以基于DMS灵活的自定义流程自定义权限能力构建自己专属DevOps解决方案,提升企业研发效率、稳定性和安全等。

image.png

让数据流动是避免数据孤岛的有效手段。而数据流动一直以来都是一个难题,存在异构、时延、一致性等问题。阿里云的DTS数据传输服务为数据的流动提供了支持。

DTS是全球首款公有云上发布数据传输服务。它融合了阿里集团内部高性能环境高稳定性数据传输要求以及阿里云上十几万客户多元多端数据流动能力能够解决数据异构传输远距离传输、弱网络传输以及数据一致等问题。

image.png

从数据中挖掘价值是每个企业在新时代下面临机遇也是巨大挑战。DMS通过逻辑数仓能力降低数据服务与应用门槛。

image.png

传统方式下,如果要查看某一类商品在某个城市卖出的单数,需要将需求提交提给BI工程师,最快速度下也需要一到两周时间才能将报表产出。但是在 DMS 下,只需要通过两条SQL即可分钟级产生报表。

image.png

如果没有数据安全,则所有其它能力都没有意义

DMS提供了全链路数据安全能力。比如事前会提供自动数据分类分级细粒度到行列级别权限管理能力;事中会提供实时动态脱敏隐私计算能力事后会提供审计数字水印溯源能力。

以上所有能力不仅服务于阿云数据库,同样服务自建数据库,也可以服务他云数据库。

image.png

另外,我们针对企业的高频场景提供了一站式产品化解决方案。

我们提供了GAD全球多活数据库,为容灾国标五级、低延时的全球就近访问等场景提供了开箱即用的能力;提供了一站式企业备份平台DBS能够满足企业多源多端统一备份、基础数据备份、日志备份、异地备份归档等需求,甚至可以提供备份数据查询。

image.png

通过数据归档结合逻辑数仓,使得对归档数据与在线未归档数据能像在一张物理表上一样使用,解决归档场景下数据查询难问题。针对商业数据库迁移的需求,我们提供了一站式解决方案,从评估改造、迁移到最终的割接,开箱即用

image.png

DMS 已经为 100 +用户提供了服务,包括开发测试运营等。我们持续关注体验和交互简单易用,因此我们在过去一年优化128项体验,同时不断上线极简模式,不断探索基于机器学习智能推荐能力。

未来,我们也将在简单易用上不断前进,持续为用户提供一站式数据库管理服务。

lQLPJxbcF2cqM2TM-M0CnrCgW_7LDpyh1wNpqgFKAPsA_670_248.png

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
相关文章
|
7月前
|
安全 数据管理 关系型数据库
Dify on DMS,快速构建开箱即用的客服对话数据质检服务
本文介绍基于 Dify 与阿里云数据管理服务 DMS 的智能客服对话质检解决方案。该方案通过集成 Dify 的 AI 能力与 DMS 的数据管理能力,实现从数据获取到质检分析的全链路闭环,提升客服质检效率与准确性,助力企业数字化转型。
634 20
|
10月前
|
安全 数据管理 数据安全/隐私保护
睿是信息携手Arctera,深化服务中国市场,共筑数据管理新未来
2025年,上海睿是信息科技有限公司与全球数据管理领导者Arctera达成战略合作,睿是信息成为Arctera中国区独家总代理。Arctera成立于2024年,源自Veritas Technologies,提供数据合规、弹性和保护解决方案,服务全球包括70%财富百强企业。睿是信息作为新一代数据安全专家,将推动Arctera产品在中国市场的覆盖,提供先进高效的数据管理服务,助力企业数字化转型与业务发展。双方合作旨在优化数据管理布局,为中国企业提供更全面、灵活的解决方案,共筑数据管理新未来。
477 0
|
人工智能 Cloud Native 多模数据库
实力见证!数据管理服务DMS、云原生多模数据库Lindorm荣获“2024技术卓越奖”
实力见证!数据管理服务DMS、云原生多模数据库Lindorm荣获“2024技术卓越奖”
327 1
|
数据管理 关系型数据库 MySQL
数据管理服务DMS支持MySQL数据库的无锁结构变更
本文介绍了使用Sysbench准备2000万数据并进行全表字段更新的操作。通过DMS的无锁变更功能,可在不锁定表的情况下完成结构修改,避免了传统方法中可能产生的锁等待问题。具体步骤包括:准备数据、提交审批、执行变更及检查表结构,确保变更过程高效且不影响业务运行。
1413 2
|
SQL 存储 数据管理
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
280 2
|
7月前
|
数据采集 存储 安全
数据治理≠数据管理!90%的企业都搞错了重点!
在数字化转型中,数据不一致、质量差、安全隐患等问题困扰企业。许多组织跳过基础的数据管理,直接进行数据治理,导致方案难以落地。数据管理涵盖数据生命周期中的采集、存储、处理等关键环节,决定了数据是否可用、可靠。本文详解数据管理的四大核心模块——数据质量、元数据、主数据与数据安全,并提供构建数据管理体系的四个阶段:评估现状、确定优先级、建立基础能力与持续改进,助力企业夯实数据基础,推动治理落地。
|
11月前
|
存储 数据管理 数据格式
数据治理 vs. 数据管理:别再傻傻分不清!
数据治理 vs. 数据管理:别再傻傻分不清!
534 10