DMS+X构建Gen-AI时代的一站式Data+AI平台

本文涉及的产品
对象存储 OSS,20GB 3个月
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介: 本文整理自阿里云数据库团队Analytic DB、PostgreSQL产品及生态工具负责人周文超和龙城的分享,主要介绍Gen-AI时代的一站式Data+AI平台DMS+X。本次分享的内容主要分为以下几个部分:1.发布背景介绍2.DMS重磅发布:OneMeta3.DMS重磅发布:OneOps4.DMS+X最佳实践,助力企业客户实现产业智能化升级

DMS+X构建Gen-AI时代的一站式Data+AI平台


内容介绍

1.发布背景介绍

2.DMS重磅发布:OneMeta

3.DMS重磅发布:OneOps

4.DMS+X最佳实践,助力企业客户实现产业智能化升级

 

01. 发布背景介绍 

1.1 阿里云瑶池数据库Data+AI

image.png

它是阿里云数据库团队认为的approach Data+AI较好的vision。在过去的18到20个月中,随着大模型的兴起,数据量不断增加,Scaling Law发挥着重要作用。在这个过程中,大模型所呈现的智能性及其效率都在发生着日新月异的变化。

(1)跨云元数据统一管理

在整个paradigm中,至关重要的是数据。这些数据不仅仅是传统数据库意义上行存或列存中的数据,更多的是多模态的数据,如表格数据、GEO Location地理信息、时序信息、向量信息等。对于不同的多模态数据,我们有不同的存储计算方式,进而选择最佳的存储和计算的技术按需使用到不同模态的数据上。对于行存、列存、不同的向量存储文件和对象,我们有不同的存储引擎和对应的执行引擎。在多模态的环境中,我们需要统一的元数据平台,为数据的应用方提供统一的平台,帮助其汇总所有的数据资产。

(2)三个关键点

要建设这样的平台,有三个关键点:

第一,统一。我们希望数据能在统一的数据目录中呈现,所有数据的操作都可以通过数据血缘等技术实现实时追踪,根据观测到的数据变化随时进行操作,最后输出给用户。

第二,交互式。我们希望与客户的开发体验是交互式的。如最近兴起的Notebook技术,它不仅可以提供传统的SQL console的SQL interface,还可以吸纳如Python、R等在数据开发应用中常用的编程paradigm。除Notebook外,还提供了任务编排能力,可以将不同原子的能力串联起来,进而根据客户不同需求产生具有业务属性的业务流程。

第三,智能化。随着AI的兴起,不断是像NL2SQL、ChatBI等应用及相关的技术都在不进步,我们希望通过智能化提升数据开发的效率。

(3)面向场景化的GEN-AI应用

在这个统一的平台之上,我们搭建了端到端的RAG+NL2SQL+Agent的面向场景化的GEN-AI应用,重点管理模型、算法、RAG的向量以及全文搜索能力。

这样,整个vision可以使数据不只停留在数据层面,而能够将数据变为intelligence,为客户产生价值。

1.2 多模数据管理平台DMS

DMS是承接Data+AI驱动的Data Manage system多模数据管理平台。在DMS中有两个非常重要的feature,即OneMeta和OneOps

image.png

OneMeta对应前文提到的“统一,我们提供开放的数据服务,可以将所有部署在不同的多云不同的数据生态中的数据资产统一进行数据的发现和操作。OneOps包括数据开发平台以及AI数据管理平台。

通过OneMeta和OneOps搭建智能化的Data Mesh使得在不同的data domain中的数据集中在统一的平台上,让用户能够进行操作,将数据价值交付效率提升十倍同时,通过OneOps平台进行一体化的数开发。最后,DMS还可通过智能化可达到开发效率及资产使用效率增。

1.3 DMS+X:统一、开放、多模的Data+AI数据管理服务

image.png

DMS产品也会联动数据库中的其他引擎,如PolarDB、ADB、LindormGen-AI级的引擎,在不同的业务场景下提供给客户最好的业务价值。这里列出了三个较典型的已经落地的场景。

(1)DMS+PolarDB & ADB

在游戏客户的智能营销方面,通过ADB进行数据的清洗特征向量的抽取,再使用PolarDB的in-DB ML的能力,向PolarDB中进行数据模型的开发部署以及推理。在客户的智能营销场景下,达到两倍的效果的提升准确率也提升了50%

(2)DMS+Analytic DB&

形成了智能大脑,为企业级客户提供了向量、SQL以及全融合搜索,支持百亿的向量规模。

(3)DMS+Lindorm

对于多模数据,特别是在一些基模公司中实现落地通过对于底层存储的不断优化,成本下降约50%。同时,通过Lindorm本身以及DMS的多模支持,能够让客户智能搜索在PB级别上达到两倍的QPS提升

接下来对OneMeta和OneOps进行展开介绍。

 

02. DMS重磅发布:OneMeta 

2.1 Data+AI数据管理趋势——分布式管理

image.png

OneMeta观察到了Data+AI领域中的管理趋势。传统的集中式数据管理模式逐渐爆发出一系列问题。在统一的数据中台,由于与各个不同的业务场景和不同的数据域相隔较远,会导致数据发现难信任难理解难一系列问题,会严重拖慢其开发效率,需求交付也会越来越慢当不同的Data domain业务场景不断增加时,实施和维护成本会大幅提升进而导致平台治理治标不治本,效率大幅下降,不可持续。因此,80%企业开始被迫或主动走向分布式管理模式。分布式管理模式下,不断弱化数据中台,将其权责下发到各个业务领域中,进行更贴近业务的数据实施和管理。分布式的开发和管理的应用中,特别是MNC等跨国大企业,需求响应及交付效率提升了十倍左右
承载分布式管理,最核心的是Data Mesh概念它将数据的所有权按照领域进行区分。基于权责的划分,数据的产品化数据治理等更高效在整个过程中,最核心的实施关键是统一开放的数据服务

2.2 DMS开放元数据服务OneMeta

DMS打造的OneMeta服务致力于DataMesh概念够真正在业务中实现落地,企业客户提供最佳的实施方案

image.png

OneMeta场景中,大致分为以下三层

(1)第一层关心的是数据如何入的问题

这些数据可能来自于不同的云端,或是部署在阿里云上部署在友商上,甚至是客户的IDC上。同时,这个数据源也可以是多模态的,或是来自于Hive的一些生态,或是来自于Flink,或是来自于MySQL、PostgreSQL等等不同的生态。在这一层,我们要尽量做到覆盖面更广,做到跨云和多模态数据支持。

(2)第二层数据服务

该部分的着力点在开放方面,开放外面的数据,包括友商或客户已经使用的数据格式以及数据对接的方式可以非常简单流入DMSOneMeta。同时,OneMeta所提供的数据服务也能够更简单被客户集成,通过开放的格式即可业务中使用

(3)最上面一层是统一的数据服务

重点包括统一的数据目录统一的访问控制数据血缘进行全域的数据修改和操作的追踪,最后落地包括安全质量的规范

2.3 Demo演示

该Demo在DMS页面上完成重点介绍多云管理的体验对于跨国公司以及企业客户,数据可能来自于阿里云,可能使用他云,如AWS数据

通过DMSOneMeta,客户能够在界面中看到在不同地域不同云端部署的数据资产。

image.png

通过统一的数据搜索即可申请权限,通过权限审批后,即可DMS的NotebookSQL console中进行数据的查询。如Demo中的SQL query可以看到,所有部署形态(他云、阿里云)以及不同生态(MySQL、PostgreSQL、OSS)下的所有数据资产通过一个SQL query查询。

image.png

 

03. DMS重磅发布:OneOps 

OneOps,即数据智能开发的能力。

3.1 DMS Data Ops 基于Notebook全新开发模式

image.png

OneOps是搭建在OneMeta之上的,其最底OneMeta的元数据服务可以帮助客户快速对接不同的数据源。数据源进后,可以通过Spark进行数据的处理,同时可以对存储在OSS上不同type(如Hudi、Parquet、CSV)的format数据进行分析存储。我们期望能够打造更交互式的开发。

这种交互式的开发中涉及了两个重要的能力。一个Notebook。Notebook是多语言的智能开发,包括SQL、Python,以及其他用户习惯的开发语言都可以通过Cell的方式非常容易集成到Notebook中。同时,Notebook支持NL2SQL、SQL自动续写,通过大模型和小模型结合了能力客户的数据开发更加简单易用一个核心能力是编排和调度。编排调度的能力决定了客户可以实现Flexible搭建有业务属性的数据操作的数据流在编排调度中,我们适配了数据开发的任务流,同时,额外加了对模型开发的任务流,使得DataOps能够打通从数据到AI中各个数据的清洗开发特征抽取等数据操作

3.2 DMS MLOps一站式服务

image.png

MLOpsDataOps的基础上进一步对智能化开发进行了能力的升级。

最底层除了传统的对于CPU资源的调度,新增对于GPU的调度,适配了不同的引擎这些引擎包括PolarDB、Lindorm、K8s接入的GPU资源进行统一节点的调度之上通过任务编排能力,进而把数据处理模型开发训练评估,以及模型的推理服务串联形成完整的Data+AI的任务流。再上在machine learning场景中非常的模型管理特征工程的处理最上是对Gen-AI一站式开发的支持,包括RAG、Agent,以及通过百炼或Defy进行大小模型的结合支持瑶池数据库原生的编排服务,再通过数据使用场景下常用的应用,如NL2SQL,Embed一些数据的精品模型整体打造DMS MLOps一站式的服务从数据特征向的抽取到模型推理,完成对据价值的进一步发现。

3.3 Demo演示

Demo将Data Ops和MLOps进行串联实现一站式的Data+AI的开发管理流程。

进入项目空间,进入Notebook界面,通过不同的代码完成Kafka中去抽取数据存入OSS、进行Spark分析整体的数据发流程。

image.png

image.png

image.png

Data Ops流程串联外,还提供了NL2SQL能力,这项内容在聚水潭有相应的场景落地。当用户输入一段文字后,它可以生成相对复杂的SQL query。这个SQL query可以与客户有相应的交互式的操作

image.png

在这个过程中,用户可以reference到带有业务属性的私域的知识库通过信息的reference标注,客户能够更好的进行数据的开发

此外,对NL2SQL的能力进行了进一步的升级。在一个垂直场景,对于SQL language不了解的客户,我们也能提供Agent能力,帮助用户在业务场景中取数的体验更加顺滑

最后流程完成后,不只是生成一个table,这table也可BI可视化的界面结合在一起,势分析等,如图所示:

image.png

根据上图,我们可以看到整个开发的操作,其趋势表现出了非常明显的Periodic的形式,可以帮助BI和数据分析的用户发现数据中的规则,提供更高的业务价值。

3.4 彩蛋

(1)在人工智能生成的时代,一站式的Data+AI数据管理平台应具备核心能力主要包括以下几项:

第一,在Data部分,需要接受来源于不同场景更多数据从传统意义上来说,如在金融场景中,可能涉及交易数据,如淘宝中交易数据,数据的概念开始在线化之后会产生很多数据。部分传统的行级数据间较长,为访问更快速,可能会将其压缩为列式。此外新能源汽车等有地理信息的数据,再如IoT device中会有streaming数据。这些数据的模态会越来越丰富。另一方面,数据的来源也会增多,除存储在阿里云上外,还有很多数据可能来自与他云,或是客户的IDC以及其他来源。对于这些大量的不同模态不同云端的数据,如何进行数据治理非常重要。因此,Data+AI时代,要做的第一件事就是需要让用户或后端APP能够有一个统一的地方看到所有的数据资产

第二,Data+AI 数据的使用方式逐渐多元化前在获取到数据后,最常进行的就是对数据进行数仓分析,在AI场景下,我们以去运行Linear Regression的最传统的ML算法,大模型出现后,搭建一个统一的平台把不同模态的数据处理方式进行更好的对接非常重要。这样,数据从最开始的留在存储介质中的01放大成为对客户的价值

第三,还有一件锦上添花的事,当今AI已普及到很多不同的场景,如生成图片视频等等,我们可以把操作简单的重复操作,甚至是繁琐操作交给有时候一些作可以交给AI,可以极大程度地释放人力。在这样的场景中,我们如何在AI平台中使用AI让AI帮助我们将从数据处理建模到数据最后发挥价值整个流程提效,也是进入下一AI Native时代的一个重要的问题。当前,数据处理的方式依赖于编程而在AI Native时代,可能仅通过一个指令即可完成,交互方式会发生变化。因此,Data+AI 需要好地拥抱AI Native时代,使用AI提升效率

(2)针对以上设想,可能存在的技术挑战如下:

以上是从业务的视角提出的期望,而技术都是为了更好的服务业务,业务驱动的,因此从技术上相关场景也会遇到一些挑战。

第一,传统的数据分析面对的数据变化相对较慢业务变化的周期相对稳定,变化趋势可以维持较长的一段时间不发生改变,因此,分析频率较低,实时性要求也相对较低。随着科技的发展,如游戏的运营,尤其是新游发版时每天涌户成千上万,每个客户行为特征也不同为了更快、更精准地筛选到付费玩家,则不可能使用过长的时间学习用户的习惯在这个人的兴趣极易分散时代,我们需要抓紧时间周期。因此,当时间窗口变短后,对于实时性的数据分析,乃至训练和推理要求越来越高。因此,在Data中不仅局限于游戏运营场景,甚至是SaaS厂商,实时分析的要求会变得越来越高。

此外,实时分析中包含在线数据,它需要与离线数据结合。如何将这一小部分数据快速变化的数据与大部分数据融合,如何更高效完成的交互,这又会涉及一些技术问题,包括如何有更好的存储?怎样有好的计算?如何使用一些新的硬件?如何对AI算法进行修改使其变成online training

第二,AI的场景中有大模型大家都使用LLM,有场景下大模型的泛化能力强,但同时也会面临幻觉的问题。当使用RAG的Paradigm解决问题时,在不同的业务场景中,随着其对精度要求越来越高,使用大模型调优的成本会非常高。此时我们开始考虑大模型和小模型如何配合的问题。如一些已被验证过的经典的小模型,其精确度可达90%、95%,甚至99%百以上在这些场景中,小模型的成本相对较低,速度也相对较快。我们要考虑如何将大模型和小模型配合更好。首先,发挥大模型泛化能力,使用较少的rap up时间,需太多的domain knowledge即可直接,且可以提供一个大致方向,准确率可达80%。然后,再与小模型在精细场景中成本低精准度更高的优势相结合。我们可以把常见的cache system的90%甚至95%query引入到小模型上,而较为少见的数据需要更好的方法能力,则使用大模型解决这个过程在技术上也存在很多挑战。如在数据库中,由于数据库是建立在Relational Algebra逻辑之上的true or false。而我们所用的Large Language Model LLM大模型基于statistics统计学之上的这两者是两个完全不同的paradigm,如何把这两种不同的paradigm中的学习方式,甚至是两个计算方式融合在一起,这个非常困难的一点。

因此,在这个场景之下,包括DMS场景,我们希望能够更好地解决这些技术场景。如在NL2SQL中将大模型小模型结合提供更好的NL2SQL和ChatBI的能力DMS中,我们将不同数据库行存列存存储引擎以及计算引擎将在线数据离线数据等不同形态的数据都使用最适合它的技术和计算方式进行操作使真正发挥云的核心竞争力。在规模化后,其成本可以直线下降这些都是非常有且令人期待的问题DMS包括整个数据库团队在这个的技术探索甚至业务探索已经迈开了第一步,后面希望能够进一步探索,发挥数据库几十年的数据处理资源使用上的经验Data+AI场景中更好地服务客户

上文从产品层面介绍DMS+X平台,后文将介绍DMS+X在企业客户产品智能化升级中的最佳实践。

 

04. DMS+X最佳实践,助力企业客户实现产业智能化升级 

4.1 Gen-AI市场普及行业情况

image.png

2022年起,千行百业正在积极拥抱这项全新的技术,其中以互联网为代表的行业如电商广告游戏娱乐产业,发展速度去极快。以电商零售为代表的电商类的企业,正在面向业务场景进行升级,实现业务增长。些企业较深的数据资产的沉淀,技术也较强,因此,Gen-AI时代它们走在发展的前列。一些教育类的企业,也正以很快的速度向整个Gen-AI进行转移因为它们良好的数据基础辅助其与AI进行快速的花碰撞

接下来,介绍企业面向商业价值通过Gen-AI手段深化探索。

4.2 DMS+X:云原生Data+AI一站式数据管理平台

DMS+X在整个云原生Data+AI时代,为企业提供了一站式的数据管理平台。通过这个平台,我们希望能够帮助更多的企业快速实现数据模型以及AI整体的使用服务于垂直行业的应用以及自身的场景

image.png

在X引擎上瑶池数据库中,无论是关系型数据库、NoSQL数据库数据仓库,包括对象存储和用户自身的开放平台都可以进行整体的数据承接和纳管

管理好企业自身的数据之后,我们可以提供OneMeta + OneOps一站式的数据端到端的开发能力,包括数据数据集成数据服务以及模型相关的模型开发模型署以及模型

同时,结合大语言模型的能力,服务于垂直行业的应用以及场景方案的落地包括了用户运营流失转换分析对于用户的体验进行提升,包括基于用户行为的相关预测,包括零电商主流的场景,如智能推荐售前智能客服等等。通过ChatBI的能力,改变用户的分析手段,通过智能化的方式智能识别企业内的数据,分析相关元素并进行适当的下钻,寻找到指标变动的根因,实现了全分析场景的自动化。此外,面向企业的IT部门,我们也进行了AIOps的提效,帮助企业实现数据管理平台智能化运维。实现一站式AI算法的同时,支持核心场景上核心算法优化,包括实时的用户行为流失预测,相较于传统模型,可实现两倍的性能提升。

一站式的MLOps端到端帮助用户实现了从数据到AI模型应用的一站式的全生命周期管理。Data+AI的全链路通过对于数据的全域管理,实现了AI所有基建以及使用体验的增强,帮助用户快速找到需要的数据,找用户数据上下游的关联,实现更好的数据治理的全域流程
最后AI智能体帮助用户将这三者结合,从数据的能力以及模型的大小,乃至模型结合能力上将其封装成面客的全新体验的Gen-AI时代下的智能体,服务于千行百业。

4.3 行业案例

(1)互联网 & 娱乐行业

image.png

①行业分析

当前的行业情况来看,更多的是通过用户的付费和广告拉动这两个行业的市场增长。用户付费是内容或者互联网产业变现的基本盘,广告变现的增速是这个产业核心收入的主要源。本质上这两者都需要提升流量运营效率以及商业运营的手段通过这样的方式进行整体上企业的持续增长。这个行业也面临着一定的困境,如用户的增速变缓内容生产的成本急剧变高,需要实现降本增效。

②解决方案

DMS+PolarDB+ADB帮助用户构建一站式的面向互联网行业的平台。面对这些挑战,我们发现,传统算法的效率性能以及数据处理的能力不足以满足未这个行业的发展更快速的响应更高效合理的广告投放策略帮助企业实现这能力的基础。DMS+PolarDB+ADB改变了数据的集成方式,可以将全域数据面向核心的数据平台进行实时的无缝集成,同时也支持用户传统的海量数据进行离线计算。

通过ADB这套平台,我们对用户的ODS、DWD、DWS的分层数据进行了全域的实时加离线的清洗,而PolarDB包括了CPU和GPU的融合算力,使得数据可以实现实时的全新的训练。通过训练的微调,可以持续保持模型的新鲜度。将这个更具新鲜度的模型投放到用户运营服务端对外提供整体的服务同时挽留用户或转化用户
更加准确的模型可以为客户带更高的价值整体上,IN-DB ML的解决方案实现了3倍的效果提升。同时,OneOps体系也实现了用户企业开发的一站式。虽然存在海量的源以及复杂的多引擎但在DMS,我们可以屏蔽这复杂的引擎管理,专注于业务开发。同时构建成本也大幅降低,帮助企业实现在降本增效,此外还可以进一步提升准确率,解决用户增速放缓的问题。

③用户流转过程

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

(2)零售行业

image.png

①行业分析

零售行业也是一个快速拥抱Gen-AI的行业。由于疫情的影响,以及整体的行业现状,目前处于供大于求的情况行业的竞争不断加剧。当前公域流量获客成本逐年增高,但由于很多企业的线上业务到了短期的瓶颈,线下的传统零售模式还没有进行整体的场景化升级。因此,零售行业的用户缺少实现用户沉淀和价值运营抓手从营销和服务的环节,零售行业的用户也希望能够深度的洞察消费者,这对于产研的压力逐渐增大。因此,如何满足零售行业的增长,技术侧如何服务于业务对于用户深度洞察和精细化运营的需求对于零售行业是一个非常大的挑战。

零售行业是一个ROI驱动的产业,其数据化基础能力基本完成,但互联网相比仍有一定的差别。零售行业有非常多的渠道,如何将这些数据进行汇聚并使用也是一项挑战。当前零售行业之间竞争加剧,企业的利润率逐年下降。此时,企业更加关注ROI因此,在AI的尝试阶段,仍处于谨慎投入的方向,所以需要明确场景和业务价值牵引的落地。

②解决方案

DMS+ADB & 大模型生态帮助企业构建一站式的Gen-AI解决方案。目前,企业更多以场景和场景所带的盈利效果进行AI方向的投入,更多关注场景。无论是企业内如产品开发部和市场运营的信息效率流转,也包括智能的数据分析帮助分析人员更快速获取用户的变化和市场的洞见。从业务侧无论是售前智能CRM还是售后智能客服在有限的资源下,都极大帮助用户进一步释放面向市场的触达效率和触达方式帮助业务寻求更多的市场的突破。智能产品匹配帮助用户以更高的效率寻找到所需的货品。通过这些方式,DMS+ADB & 大模型生态正在重塑零售行业。同时,也帮助零售的客户从业务场景出发,真正做到投入有价值。

DMS上通过了开放的生态集成,包括和外部厂商多数据源以及开源生态集成,帮助用户实现中心化存储全局数据管理通过RAGADB并结合通义通模型帮助他们提高了数据分发效率如企业的智能运营包括对外的CRM和智能客服大幅提升了服务效率。最终通过DMS一站式的平台,用户在Gen-AI时代下取得了业务的突破也实现了用户管理效率和信息流动效率的提升。

目前,各零售用户通过百亿次的数据查询进行了数据资产的变现。

③客户案例

image.png

这个案例主要介绍DMS+ADB & 大模型生态帮助企业进行智能化的管理的解决方案。该公司是一家物流企业,他们需要对于每一次用户的触达进行整体的质量分析,同时在每一次和客户沟通后,需要将整个的信息录入CRM系统当前,其瓶颈在于每天电话营销人员可以触达的用户仅有100多次。大语言模型和DMS+X从两个方面帮助用户实现营销效率的提升。

第一,帮助用户每一次的电话语音自动化面向CRM系统进行内容的填写和生成,使得电话营销人员单次用户沟通的成本大幅下降在一定的时间范围内触达用户的次数随之增加。第二,可以对填写内容以及电话录音转文字数据进行销售的质检,确保每一次和用户的沟通符合规范,达成了推荐和能力确保每一次的电话沟通具备一定的复制价值。因此,将智能的质检也加入到智能的CRM体系中帮助用户实现更加高质量的通话和更加简洁的通话CRM自动化录入操作,实现整体的高质量的CRM前置流程帮助他们实现业务的增长

(3)基模行业

image.png

①行业分析

基模行业是大语言模型最为基础的行业,当前基模行业正在处于高速发展中,具有潜在的千亿级别的市场。对于基模行业而言,它所要处理的数据是之前的10倍不止。而多模态的数据处理同样格外注重处理的效率以及处理的安全同时头部厂商如阿里占据主导地位,基模的友商也在积极寻找场景化的服务和独特的技术特点进行相关的增长。

②解决方案

多模态的数据处理和多模态的数据管理对于基模厂商讲至关重要,DMS + Lindorm的方案可帮助客户实现全域多模资产集中式的管理并通过Lindorm的融合引擎实现了面向AI的数据基础管理以及数据之上构建企业独特场景的价值服务,其中包括模型训练基模厂商场景化应用如智能搜索场景。

③客户案例

以下是DMS+Lindorm一站式服务于基模厂商自建的智搜的一系列的RAG服务。

image.png

基模厂商自身是有海量的数据。而搜索,面向的是整个互联网的数据,只有将这些数据进行采集以及存储,才能在用户检索过程中识别高质量的数据以提供给客户。因此,需要在全量数据采集后进行一系列复杂的分级分类和权限赋予,进而实现数据处理。在处理之后,服务引擎实际上是通过一个融合查询提升整体的召回效率。通过全文检索和向量检索的融合检索,实现百亿甚至千亿级别的数据在线服务。而膜厂商构建的全新的智搜体验也是通过原有的RAG链路,包括用户的实时query通过了用户的响应之后,利用大模型prompt engineer,完成召回结果的Rerank和融合的排序最终实现了高精度海量数据的智能检索。通过这样的方式,今天的搜索体验从原的列表式搜索变成了全新智能检索的体验,这也是下一个时代的风口。

(4)数据库行业

image.png

①解决方案

DMS+X的X引擎已获得了大量客户信任,为帮助这些企业实现下一步智能运维,满足智能化的使用体验,DMS+X和DAS产品进行联动,通过构建阿里云智能运维的大模型,服务于数据库的整体使用包括数据库集群的异常检查智能告警,在发现异常之后,帮助用户分析服务器的情况和数据使用的情况做到快速的智能根定位并完成智能恢复,同时做到空间的优化。对于洞察和安全,我们也提供了智能化的服务,包括SQL使用情况以及智能化保护企业数据安全。

②客户案例

以下是阿里云面向客户的服务的过程中,通过使用DMS+X和DAS帮助用户智能化运维自建数据库的案例。

image.png

DAS帮助用户通过管理用户的使用日志进行智能化的潜在风险识别潜在慢SQL的识别、潜在数据洞察风险的识别,并将这些识别进入模型进行相关的推理,推理完成后,用户提出合理化的建议并帮助用户进行交互式的根因定位排查。通过以上服务,客户可以产生主动的运维报警,交互式找到核心问题,同时参考推荐的方式智能化地解决异常问题。这部分内容将来会提供给所有瑶池数据库用户的全新的数据库运维管理体验。

4.4 DMS+X伙伴拓展(钉钉)

image.png

今天,DMS+X拓展了钉钉渠道作为核心伙伴,一起累计3000家企业提供服务能够实现安全准确的企业级服务覆盖营销审批人事财务差旅等企业核心场景。同时,也和钉钉实现云端一体的合作体验,包括机场的智能化大屏社区门店的智能化客户导购一起帮助千行百业落地符合自身商业场景的相关形态。

同时,DMS自研的精品模型NL2SQL做到了82%以上的准确率。面对部分高精度需求客户,也一起实现到95%-99%的准确率既满足了企业不同层面所需要AI能力同时也做到了300msRT(交互返回时间),保证业务的流畅性和用户体验的流畅性。并且,结果非常稳定,可以稳定持续性地共同服务于客户。

 

4.5 彩蛋

1生成式人工智能时代的Data+AI产品相较于之前的产品的区别如下:

Gen-AI的出现彻底改变了Data+AI的使用模式,今天的产品更多地服务于用户的业务。从以终为始的角度思考,Data+AI更多是技术。用户的业务诉求包括两方面,一是提效,二是增长。面向这两个场景,过去的一段实践,从最早的全瀑布式开发变成局部的敏捷式开发。而Gen-AI的出现,完成了到全局开发的转变。随着大语言模型、ChatGPT的出现,用户可以基于自己现有的数据直接和大语言模型产生关系,并快速完成业务验证,直接体验到业务价值。而原来的全局瀑布式开发和局部敏捷式开发要先对所有的数据进行处理开发,业务人员再通过这些数据提取价值,在完成局部的敏捷验证之后,再将模型引入,提升使用效果。最终经过A/B testing或灰部发布后的模型迭代,服务于业务,验证数据价值。但并非所有的企业都可负担得起。而大语言模型将企业所有的数据与之结合,实现可观测、可使用的初步业务价值的POC。在将该能力提供到市场后,即可实现快速验证。换言之,它将原来的顺序执行路径变成了两端不断随着业务价值迭代的双向的实现。

同时,随着业务价值要求的不断变高,再将中间流程补全。如存在脏数据,则需进行数据处理,即对全域数据的下一步处理加工。如果服务中大语言模型有无法覆盖的能力,则可以再通过AI进行模型的训练调整,通过小模型的能力补全。此时,Data和AI从两端向中间的双向奔赴。在长时间的技术演进过程中,顺序开发的流程非常完备,我们也希望它可以与大语言模型碰撞出火花,从两端进行快速的业务实现。此外,将中间的能力提供给客户面向整个业务价值的敏捷迭代。因此,Data+AI产品是从局部的敏捷变成了全局的面向业务的敏捷。对于产品而言,它需要符合用户在Gen-AI时代下的开发模式和开发习惯。除大语言模型之外,不是技术蓝海,而是业务场景蓝海。我们要更多专注于客户的业务价值,用户可以从DMS+X的全一站式平台上快速敏捷地选择所需的服务,管理全域的数据资产,实现面向业务价值的最终变现,这也是Data+AI在这个时代下的新的价值。

(2)在技术的加持,发展的机会包括两个方面:

第一,可以帮助用户实现他的业务重构。在大模型出现之初,很多企业实际上是公司级别的战略,即Top-down。而Top-down较为困难,因为其是全民接信。用户认为大语言的交互模式以及信息传播模式可以重塑千行百业。而在一年之后,全行业正在向Gen-AI奔赴。此时,在全新的交互模式下,用户和阿里云都在不断探索垂直领域的重塑。如数字人技术、智能客服技术、智能销售、技术,在体验、效率以及服务逻辑都进行着重构。所以,更多的是要以产品的能力服务于用户重塑的诉求,即阿里云为客户提供的相应的价值。

第二,对阿里云自身的发展也有一定的价值。在过去,阿里云完成了技术的快速发展,数据库技术的提升突飞猛进。在下一代,阿里云应如何进行数据管理与治理?如何低成本、智能化地将阿里云数据的服务经验沉淀到模型中或服务中,帮助用户更好地使用数据库。阿里云DMS+DAS正在进行相关的实践,无论是从开发体验,或是数据库运维自动化的自动驾驶策略,这两者之间都在重塑提供给用户的数据库使用价值,即PaaS层的智能价值。我们将这些经验沉淀到大模型,并在工具上加持,为用户提供相应的能力,使其使用更加方便。

总之,机会点一是要紧盯住行业的业务蓝海,通过技术能力与客户一起实现AI原生时代的改造;二是自身拥抱AI,提升AI带来的经验型的赋能,帮助用户更好地使用产品,构建与客户一起的价值锚点。

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
目录
打赏
0
相关文章
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
115 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
Pipecat实战:5步快速构建语音与AI整合项目,创建你的第一个多模态语音 AI 助手
Pipecat 是一个开源的 Python 框架,专注于构建语音和多模态对话代理,支持与多种 AI 服务集成,提供实时处理能力,适用于语音助手、企业服务等场景。
56 23
Pipecat实战:5步快速构建语音与AI整合项目,创建你的第一个多模态语音 AI 助手
24.7K Star!用 KHOJ 打造你的AI第二大脑,自动整合和更新多源知识,轻松构建个人知识库
KHOJ 是一款开源的个人化 AI 助手,支持多源知识整合、语义搜索、个性化图像生成等功能,帮助用户高效管理知识库。
129 23
24.7K Star!用 KHOJ 打造你的AI第二大脑,自动整合和更新多源知识,轻松构建个人知识库
AnalyticDB PostgreSQL版:Data+AI 时代的企业级数据仓库
AnalyticDB PostgreSQL版是面向Data+AI时代的企业级数据仓库,涵盖产品架构、核心技术、客户案例及功能发布四大部分。产品架构包括数据分析和AI/ML的存储与计算优化;核心技术涉及高性能实时引擎Beam、向量化执行引擎Laser及优化器Orca;客户案例展示了丝芙兰和领跑汽车的应用;新功能如pgsearch全文检索和In-Database AI/ML进一步提升了性能与易用性。
跨云数据管理平台DMS:构建Data+AI的企业智能Data Mesh
跨云数据管理平台DMS助力企业构建智能Data Mesh,实现Data+AI的统一管理。DMS提供开放式元数据服务OneMeta、一站式智能开发平台和云原生AI数据平台,支持多模数据管理和高效的数据处理。结合PolarDB、AnalyticDB等核心引擎,DMS在多个垂直场景中展现出显著优势,如智能营销和向量搜索,提升业务效率和准确性。通过DataOps和MLOps的融合,DMS为企业提供了从数据到AI模型的全生命周期管理,推动数据驱动的业务创新。
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
93 31
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
98 23
AI实践:智能工单系统的技术逻辑与应用
智能工单系统是企业服务管理的核心工具,通过多渠道接入、自然语言处理等技术,实现工单自动生成、分类和分配。它优化了客户服务流程,提高了效率与透明度,减少了运营成本,提升了客户满意度。系统还依托知识库和机器学习,持续改进处理策略,助力企业在竞争中脱颖而出。
15 5

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等