达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-SPACE-D:可信赖的文档对话

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-


 

image.png

 

根据Gartner2020的报告,企业中80%以上的数据,都是以非结构化形式存在的,而文档在其中的占比最为突出。其中,在政务、保险、电力、医疗等9个行业中,文档应用非常广泛。

 

image.png

 

MRC技术在落地过程中遇到的第一个挑战就是模型太大,性能、效果一般;我们的解决方向是打造了以半参数化神经网络为基础的文档对话机器人Doc2Bot之前的机器阅读,是根据问题在文档中进行生成或者查找,在理念良好的情况下,落地会遇到非常多的问题

 

而当Doc2Bot收到文档时,会采用一系列的知识发现技术,把整个文档转化成结构化的知识数据库。紧接着根据用户问题进行知识定位,然后生成答案。通过半参数化的方式,把知识进行外部存储,用神经网络进行推理并生成答案,最终实现知识存储和模型推理的分离。

 

通过上述方式带来的好处是,大量工作在离线完成,在线模型性能,不管是延迟、QTS等可以快速大幅提升。除此之外,由于知识已经结构化,所以效果会更加精准。

 

image.png

 

接下来,问绕着文档对话我们生成了可开箱即用的Space-D大模型。Space-D把知识发现和文档对话,进行统一预训练。无论是知识发现、知识定位、回复生成等任务,都会在大模型里进行统一建模。基于Space-D,我们可以把DocBot文档对话机器人在阿里云智能客服中进行落地。

image.png

 

通过SPACE-D技术,想进一步使文档对话机器人做到可信赖、可解释。我们希望机器人能够言之有据、言之有理。言之有据指的是当用户提出问题时,不仅能给出答案,还能在文档中找到引用。

 

言之有理则是指,希望这个模型具备一定的推理能力。我们基于SPACE-D的大模型,提出基于思维链、模仿人类的思维探测方法。将人类推理思考的过程和Space-D结合在一起,从而使模型具备推理能力;基于思维链的推理能力,在国际权威常识推理榜单Commonsense2.0中,取得了第一名的成绩。

 

image.png

 

以上就是阿里云智能客服在对话方面取得的一些核心成果。简单总结下,打造了通义对话大模型SPACE体系。

 

在任务型对话方面,基于SPACE模型打造了分布式对话智能的能力。

 

在表格方面,打造了SPACE-T模型,实现了客服问答的开箱即用落地,同时把技术能力推广到智能BI领域。

 

在文档领域,打造了SPACE-D模型,让文档对话在不同业务领域落地,同时探索可解释、可信赖方向进行了积极探索;在一些场景能够做到言之有理、言之有据。

 

image.png

 

达摩院对话智能一直在用基础研究开拓业务落地的边界。整个团队在过去六个月一共发表了21篇国际顶会论文。在10月份放榜的EMNLP 2022会议上,一次性上榜十篇论文。意味着在全球范围内,无论面对企业、个人,都取得了首屈一指的成绩。

 

面向未来,我们希望会继续在基础研究和业务落地相互促进的道路上前进,尽快实现人机自由对话的理想

 

 

 

 


 

 

 

 


 

相关文章
|
3月前
|
人工智能 自动驾驶 云栖大会
大模型赋能智能座舱,NVIDIA 深度适配通义千问大模型
9月20日杭州云栖大会上, NVIDIA DRIVE Orin系统级芯片实现了与阿里云通义千问多模态大模型Qwen2-VL的深度适配。阿里云、斑马智行联合NVIDIA英伟达推出舱驾融合大模型解决方案,基于通义大模型开发“能听会看”的智能座舱助理,让车内人员通过语音交流就能操作座舱内的各类应用,享受极致丰富的交互体验。
265 14
|
10天前
|
开发框架 自然语言处理 JavaScript
千问开源P-MMEval数据集,面向大模型的多语言平行评测集
近期,通义千问团队联合魔搭社区开源的多语言基准测试集 P-MMEval,涵盖了高效的基础和专项能力数据集。
|
13天前
|
缓存 API 开发工具
Qwen-coder方向-如果从0开始应用通义千问开源大模型
从0开始接触,带您全面了解Qwen2.5语言模型家族,包括其核心功能、微调方法以及具体应用场景。我们将通过一系列精心准备的应用demo和使用指南,帮助您掌握如何充分利用Qwen2.5的强大能力
177 8
|
26天前
|
人工智能 开发者
再次获奖!世界互联网大会把荣誉给了通义大模型
再次获奖!世界互联网大会把荣誉给了通义大模型
40 11
|
1月前
|
人工智能 边缘计算 自然语言处理
DistilQwen2:通义千问大模型的知识蒸馏实践
DistilQwen2 是基于 Qwen2大模型,通过知识蒸馏进行指令遵循效果增强的、参数较小的语言模型。本文将介绍DistilQwen2 的技术原理、效果评测,以及DistilQwen2 在阿里云人工智能平台 PAI 上的使用方法,和在各开源社区的下载使用教程。
|
2月前
|
自然语言处理 Java API
Spring Boot 接入大模型实战:通义千问赋能智能应用快速构建
【10月更文挑战第23天】在人工智能(AI)技术飞速发展的今天,大模型如通义千问(阿里云推出的生成式对话引擎)等已成为推动智能应用创新的重要力量。然而,对于许多开发者而言,如何高效、便捷地接入这些大模型并构建出功能丰富的智能应用仍是一个挑战。
230 6
|
2月前
|
前端开发 算法 测试技术
前端大模型应用笔记(五):大模型基础能力大比拼-计数篇-通义千文 vs 文心一言 vs 智谱 vs 讯飞vsGPT
本文对比测试了通义千文、文心一言、智谱和讯飞等多个国产大模型在处理基础计数问题上的表现,特别是通过链式推理(COT)提示的效果。结果显示,GPTo1-mini、文心一言3.5和讯飞4.0Ultra在首轮测试中表现优秀,而其他模型在COT提示后也能显著提升正确率,唯有讯飞4.0-Lite表现不佳。测试强调了COT在提升模型逻辑推理能力中的重要性,并指出免费版本中智谱GLM较为可靠。
前端大模型应用笔记(五):大模型基础能力大比拼-计数篇-通义千文 vs 文心一言 vs 智谱 vs 讯飞vsGPT
|
2月前
|
存储 人工智能 Serverless
通义千问大模型
在数字化时代,企业面临海量客户对话数据处理的挑战。阿里云推出的AI大模型助力客户对话分析方案,通过整合多种云服务,实现对话内容的自动化分析,提升服务质量和客户体验。本文将深入评测该方案的优势与实际应用效果。
|
2月前
|
前端开发 JavaScript API
2025年前端框架是该选vue还是react?有了大模型-例如通义灵码辅助编码,就不用纠结了!vue用的多选react,react用的多选vue
本文比较了Vue和React两大前端框架,从状态管理、数据流、依赖注入、组件管理等方面进行了详细对比。当前版本和下载量数据显示React更为流行,但Vue在国内用户量增长迅速。Vue 3通过组合式API提供了更灵活的状态管理和组件逻辑复用,适合中小型项目;React则更适合大型项目和复杂交互逻辑。文章还给出了选型建议,强调了多框架学习的重要性,认为技术问题已不再是选型的关键,熟悉各框架的最佳实践更为重要。
|
2月前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了一种结合知识图谱与大型语言模型(LLM)的GraphRAG系统,利用PolarDB、通义千问及LangChain实现。知识图谱通过结构化信息、语义理解和推理等功能,增强了信息检索与自然语言处理效果。PolarDB具备图引擎与向量检索能力,适配知识图谱存储与查询。通义千问处理自然语言,LangChain则整合模型与应用。实战步骤包括环境准备、数据库配置与数据导入,并通过实例展示了图谱与向量联合检索的优越性,提升了问答系统的准确性和实用性。

热门文章

最新文章

下一篇
DataWorks