达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-SPACE-D:可信赖的文档对话

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-


 

image.png

 

根据Gartner2020的报告,企业中80%以上的数据,都是以非结构化形式存在的,而文档在其中的占比最为突出。其中,在政务、保险、电力、医疗等9个行业中,文档应用非常广泛。

 

image.png

 

MRC技术在落地过程中遇到的第一个挑战就是模型太大,性能、效果一般;我们的解决方向是打造了以半参数化神经网络为基础的文档对话机器人Doc2Bot之前的机器阅读,是根据问题在文档中进行生成或者查找,在理念良好的情况下,落地会遇到非常多的问题

 

而当Doc2Bot收到文档时,会采用一系列的知识发现技术,把整个文档转化成结构化的知识数据库。紧接着根据用户问题进行知识定位,然后生成答案。通过半参数化的方式,把知识进行外部存储,用神经网络进行推理并生成答案,最终实现知识存储和模型推理的分离。

 

通过上述方式带来的好处是,大量工作在离线完成,在线模型性能,不管是延迟、QTS等可以快速大幅提升。除此之外,由于知识已经结构化,所以效果会更加精准。

 

image.png

 

接下来,问绕着文档对话我们生成了可开箱即用的Space-D大模型。Space-D把知识发现和文档对话,进行统一预训练。无论是知识发现、知识定位、回复生成等任务,都会在大模型里进行统一建模。基于Space-D,我们可以把DocBot文档对话机器人在阿里云智能客服中进行落地。

image.png

 

通过SPACE-D技术,想进一步使文档对话机器人做到可信赖、可解释。我们希望机器人能够言之有据、言之有理。言之有据指的是当用户提出问题时,不仅能给出答案,还能在文档中找到引用。

 

言之有理则是指,希望这个模型具备一定的推理能力。我们基于SPACE-D的大模型,提出基于思维链、模仿人类的思维探测方法。将人类推理思考的过程和Space-D结合在一起,从而使模型具备推理能力;基于思维链的推理能力,在国际权威常识推理榜单Commonsense2.0中,取得了第一名的成绩。

 

image.png

 

以上就是阿里云智能客服在对话方面取得的一些核心成果。简单总结下,打造了通义对话大模型SPACE体系。

 

在任务型对话方面,基于SPACE模型打造了分布式对话智能的能力。

 

在表格方面,打造了SPACE-T模型,实现了客服问答的开箱即用落地,同时把技术能力推广到智能BI领域。

 

在文档领域,打造了SPACE-D模型,让文档对话在不同业务领域落地,同时探索可解释、可信赖方向进行了积极探索;在一些场景能够做到言之有理、言之有据。

 

image.png

 

达摩院对话智能一直在用基础研究开拓业务落地的边界。整个团队在过去六个月一共发表了21篇国际顶会论文。在10月份放榜的EMNLP 2022会议上,一次性上榜十篇论文。意味着在全球范围内,无论面对企业、个人,都取得了首屈一指的成绩。

 

面向未来,我们希望会继续在基础研究和业务落地相互促进的道路上前进,尽快实现人机自由对话的理想

 

 

 

 


 

 

 

 


 

相关文章
|
3月前
|
自然语言处理 IDE 测试技术
灵动指间,快码加编,你的智能编码助手 ——通义灵码
通义灵码是一款强大的智能编码辅助工具,具备优秀的代码补全、快速生成、全面功能、强兼容性和企业私域知识库支持等优点。它能显著提升开发者的编码效率,减少错误,支持200多种编程语言,兼容主流IDE,是现代编程的理想助手。
125 0
|
1月前
|
JSON 自然语言处理 Serverless
基于阿里云通义千问开发智能写作助手
现代办公中,撰写邮件、会议记录、报告等任务耗费大量时间。一个智能写作助手能显著提升效率,帮助用户快速生成高质量的文本内容。阿里云通义千问作为阿里巴巴推出的强大大语言模型(LLM),具备出色的自然语言理解与生成能力,非常适合用于开发智能写作工具。本博客将介绍如何基于通义千问构建一个智能写作助手,实现高效的内容生成和编辑功能。
76 2
|
11天前
|
关系型数据库 机器人 OLAP
智答引领|AnalyticDB与通义千问大模型联手打造社区问答新体验
PolarDB开源社区推出基于云原生数据仓库AnalyticDB和通义千问大模型的“PolarDB知识问答助手”,实现一站式全链路RAG能力,大幅提升查询效率和问答准确率。该系统整合静态和动态知识库,提供高效的数据检索与查询服务,支持多种场景下的精准回答,并持续优化用户体验。欢迎加入钉群体验并提出宝贵意见。
智答引领|AnalyticDB与通义千问大模型联手打造社区问答新体验
|
24天前
|
开发框架 自然语言处理 JavaScript
千问开源P-MMEval数据集,面向大模型的多语言平行评测集
近期,通义千问团队联合魔搭社区开源的多语言基准测试集 P-MMEval,涵盖了高效的基础和专项能力数据集。
千问开源P-MMEval数据集,面向大模型的多语言平行评测集
|
2天前
|
编解码 Cloud Native 算法
通义万相:视觉生成大模型再进化
通义万相是阿里云推出的视觉生成大模型,涵盖图像和视频生成。其2.0版本在文生图和文生视频方面进行了重大升级,采用Diffusion Transformer架构,提升了模型的灵活性和可控性。通过高质量美学标准和多语言支持,大幅增强了画面表现力。此外,视频生成方面引入高压缩比VAE、1080P长视频生成及多样化艺术风格支持,实现了更丰富的创意表达。未来,通义万相将继续探索视觉领域的规模化和泛化,打造更加通用的视觉生成大模型。
|
11天前
|
机器学习/深度学习 人工智能 安全
通义视觉推理大模型QVQ-72B-preview重磅上线
Qwen团队推出了新成员QVQ-72B-preview,这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色,尤其在数学推理任务中取得了显著进步。尽管如此,该模型仍存在一些局限性,仍在学习和完善中。
|
27天前
|
缓存 API 开发工具
Qwen-coder方向-如果从0开始应用通义千问开源大模型
从0开始接触,带您全面了解Qwen2.5语言模型家族,包括其核心功能、微调方法以及具体应用场景。我们将通过一系列精心准备的应用demo和使用指南,帮助您掌握如何充分利用Qwen2.5的强大能力
243 8
|
2月前
|
算法 机器人 语音技术
由通义千问驱动的人形机器人具身智能Multi-Agent系统
申昊科技人形机器人小昊,集成通义千问多模态大模型的具身智能系统,旨在讲解销售、迎宾表演等场景。机器人通过语音、动作等方式与用户互动,利用云端大语言模型处理自然语言,结合视觉、听觉等多模态感知技术,实现流畅的人机对话、目标追踪、展厅讲解等功能。
240 4
由通义千问驱动的人形机器人具身智能Multi-Agent系统
|
25天前
|
人工智能 运维
有奖调研:通义灵码邀请您填写信通院 2024 年度智能化软件工程现状调研问卷
为深入了解软件工程智能化发展现状、各阶段应用情况、未来落地趋势等,中国信通院联合阿里(通义灵码)、中国工商银行、中国邮政储蓄银行、硅心科技、华为、腾讯、百度、抖音、中兴通讯、360、软通动力、Testin 云测、高效运维社区共同发起 2024 年度智能化软件工程现状调研。调研对象为各行业中凡是具有软件研发团队的企业。
|
1月前
|
机器学习/深度学习 数据采集 存储
通义千问 Qwen 在智能文本分析中的应用实践
本文探讨了通义千问Qwen在智能文本分析的应用,涵盖文本分类、情感分析及关键信息提取,通过具体案例和代码实现,展示了Qwen的强大语言理解能力,为开发者和研究人员提供了实用参考。

热门文章

最新文章