拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数

简介: 「拥抱Data+AI」系列文章由阿里云瑶池数据库推出,基于真实客户案例,展示Data+AI行业解决方案。本文通过钉钉AI助理的实际应用,探讨如何利用阿里云Data+AI解决方案实现智能问数服务,使每个人都能拥有专属数据分析师,显著提升数据查询和分析效率。点击阅读详情。

导 语


本文为数据库「拥抱Data+AI」系列连载第5篇,该系列是阿里云瑶池数据库面向各行业Data+AI应用场景,基于真实客户案例&最佳实践,展示Data+AI行业解决方案的连载文章。


本篇文章结合钉钉AI助理的实际场景应用,深入探讨如何利用阿里云Data+AI解决方案实现智能问数服务,实现人人都有自己的专属数据分析师,大幅提高数据查询及分析效率。


1公司及业务介绍


钉钉是一款由阿里巴巴集团推出的企业级通讯工具,旨在为企业提供一个高效、安全的移动办公平台。它提供了多种功能,如即时通讯、视频会议、文件管理、考勤打卡等,帮助企业实现跨部门、跨地域的协同办公。在以“我的超级助理”为主题的钉钉7.5产品发布会上,正式发布了基于70万家企业需求共创的AI助理产品,该产品的发布进一步推动降低了AI的使用门槛,让人人都能轻松创建自己的AI助理。


钉钉AI助理的智能问数功能,在接入业务数据后可以跨越多个应用场景,查询和分析销售、差旅、人事等方面的经营数据。用户可以基于自己在钉钉沉淀的数据进行自由提问,官方预置的指令中心帮助用户低门槛快速上手正确的提问方式。通过对话式数据AI,结合知识图谱、自然语言理解等能力,智能问数为企业用户提供智能问答、智能推荐、预警归因等功能,帮助用户方便快捷地查找数据、简单直观地解读数据、智能深入地挖掘数据,实现人人都有自己的专属数据分析师,大幅提高数据查询及分析的效率。


image.gif

AI助理智能问数场景


2 DMS+AnayticDB支持智能问数场景


向量召回提升模型输出准确率


在智能问数场景中,如何在问答过程中准确定位实体(如分公司名称、部门名称、专有名词等)是一个难点问题。比如,管理者通过自然语言输入“帮我查看华东区域xx产品第三季度业绩”,华东区域到底包含哪些分公司呢?又比如“查看产品部Q1绩效”,产品部在该企业内部全称是产品设计及管理部。又比如产品SKU在企业内部有特殊代号,大模型无法识别这些特殊的代号。总体而言,结合企业专属数据提供贴近企业需求的AI服务难度是非常大的。

因此,通过AnayticDB for PostgreSQL向量检索引擎对10亿+核心企业实体(企业名称、部门名称、员工名称、专有名词等)实现向量化,针对企业用户随意输入的问题通过向量检索召回最准确的企业实体,然后再结合大模型提供智能问答、智能问数等服务,大大提升了AI助理对实体的识别和大模型准确率。


构建企业专属实体知识库


大模型虽然能解答普适性的问题,但在一些垂直领域上无法覆盖企业专属知识以及无法保障数据更新时效性,导致大模型应用在企业中落地困难。企业可采用 DMS+AnayticDB for PostgreSQL 向量检索引擎构建企业专属知识库,对结构化、半结构化和非结构化数据通过 Embedding 向量化后存储到 AnayticDB for PostgreSQL 中。结合大模型推理服务,将企业私有数据融入到智能问答、智能问数、智能创造等大模型应用中。构建企业专属大模型知识库的步骤大致如下:


1)数据预处理:在向量化之前需要对非结构化的文档、图片进行预处理,包括文档/图片解析、切块,预处理的质量会对问答召回和准确率有非常大的影响。


2)Embedding: 通过大模型的Embedding算法对预处理后的数据块进行向量化,并将结果存储到向量数据库中。


3)向量检索: 大模型将用户的问题进行向量化后在向量数据库中进行向量检索和近似度计算,同时结合结构化的条件过滤进行权限和范围的限定


4)查询召回:大模型对向量检索的结果进行推理求解最终返回最接近问题的答案,因为语义检索的覆盖面可能不全,因此可以结合全文检索对答案进行补充。


image.gif

构建企业专属知识库


3高度数据安全的ChatBI能力


企业可以在公共云上开启 AnayticDB for PostgreSQL 专属实例存储企业专属数据,通过DMS构建数据流程编排服务,实现业务逻辑的ChatBI编排和私域精品NL2SQL模型部署,满足不同企业对数据不出域的最高安全的要求。结合 AnayticDB for PostgreSQL 行/列级权限控制、动态数据脱敏、数据加密、SQL审计等手段最大化保障企业数据安全。让企业在使用大模型应用服务带来的便捷性同时又无需担心私域数据安全性问题。


image.gif

4DMS+AnalyticDB优势特点


优势1:一站式融合分析


用户只需要通过一条SQL即可实现结构化数据分析、向量分析和全文检索三者融合,实现多路召回。


优势2:社区合作紧密


AnalyticDB for PostgreSQL 结合DMS,通过OneMeta+OneOps可以部署并实现数据的全域管理,数据开发, 模型推理服务及开源的dify框架,进行端到端的Data+AI流程编排。


优势3:功能完善,性能极致


  • 支持向量数据流式导入,索引压缩,事务,和各类相似度算法。
  • 较比同类产品有更高的写入吞吐和查询性能。

优势4:解决方案丰富

  • DMS+X 提供从文档解析、Chunk、Embedding、向量近似度计算、检索全套OpenAPI服务,让用户快速落地。
  • 提供DMS之上的Data+AI能力的开箱即用和Dify的一键部署方式,在10分钟内一键构建企业专属大模型和向量数据库,快速搭建企业级Gen-AI应用。
  • 支持构建图搜图、文搜图等产品化解决方案。

优势5:精品NL2SQL模型

  • 开箱即用:自识别用户数据库元数据,实现开箱自助分析。
  • 大小模型融合:创新性地使用大模型分析用户意图,小模型准确SQL生成的融合形态,实现更精准的服务。
  • 数据私域安全保障:全数据链路及推理服务私域部署,实现数据不出域,保障企业数据安全,DMS自研NL2SQL模型提供了3个等级的准确率。
  • 效果可持续优化:结合持续学习、历史记录标注、RAG干预等方式,实现准确率可调优;目前提供了3个等级的NL2SQL的模型能力。


image.gif


5总结与展望


钉钉AI助理通过采用AnayticDB向量

检索引擎构建企业专属知识库,结合大模型推理服务,将企业私有数据融入到智能问答、智能问数、智能创造等应用中,并通过DMS构建数据流程编排服务,实现业务逻辑的ChatBI编排和私域精品NL2SQL模型部署,满足不同企业对数据不出域的最高安全的要求。钉钉AI助理目前已累计服务了上千客户,涉及零售、互联网、物流、交通等多个行业。Data+AI为企业提供了新的增长途径,企业必须认识到Data+AI的重要性,并将其作为战略实施重点。


通过将Data+AI融入核心业务,企业能够更好地挖掘数据价值,优化运营流程和决策机制,从而促进智能化转型,显著提升市场竞争力。


未来,借助阿里云Data+AI解决方案的可自定义编排的LLM工作流以及不断提供的解决方案,不仅能够实现智能问数的拓展应用,还能够通过大模型方案解决企业经营的各项问题,从而提升经营效率,加速企业智能化转型,为企业发展带来新的动力。


Data+AI 专家咨询

相关实践学习
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
人工智能 自然语言处理 Devops
云效 AI 智能代码评审体验指南
云效AI智能代码评审正式上线!在合并请求时自动分析代码,精准识别问题,提升交付效率与质量。支持自定义规则、多语言评审,助力研发效能升级。立即体验AI驱动的代码评审革新,让AI成为你的代码质量伙伴!
536 7
|
4月前
|
人工智能 自然语言处理 算法
【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”
2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”
587 9
|
4月前
|
机器学习/深度学习 人工智能 算法
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
本数据集包含2500张已标注实验室设备图片,涵盖空调、灭火器、显示器等10类常见设备,适用于YOLO等目标检测模型训练。数据多样、标注规范,支持智能巡检、设备管理与科研教学,助力AI赋能智慧实验室建设。
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
|
4月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
754 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
4月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
817 1
|
4月前
|
人工智能 编解码 搜索推荐
AI智能换背景,助力电商图片营销升级
电商产品图换背景是提升销量与品牌形象的关键。传统抠图耗时费力,AI技术则实现一键智能换背景,高效精准。本文详解燕雀光年AI全能设计、Canva、Remove.bg等十大AI工具,涵盖功能特点与选型建议,助力商家快速打造高质量、高吸引力的商品图,提升转化率与品牌价值。(238字)
493 0
|
4月前
|
人工智能 自然语言处理 小程序
拔俗AI审前服务平台:让法律准备更智能、更高效,助力司法公正提速
AI审前服务平台融合大模型与法律知识,智能解析证据、推送类案、评估风险,助力律师高效备诉、当事人理性维权,推动法律服务普惠化、精准化,是智慧司法的重要基石。(238字)
216 0

相关产品

  • 数据管理