达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-SPACE-T:从客服迈向智能BI

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-


 

image.png

 

表格是各行各业最普遍的结构化数据或知识的存储形式。企业只要有信息化系统,就会有SQL数据库与表格。

 

image.png

 

早在2019年阿里云智能客服就开始进行Table QA的研究与落地。在全球范围来看,都属于最早切入这个方向的研究者和实践落地团队。经过数年打磨,Table QA在阿里云智能客服产品矩阵中大规模落地。

 

我们已经实现多轮对话能力、多表联合查询能力。企业百万行级的数据库可以一次性接入,再大量级的数据库可以做水平扩展;整个开箱准确率达到85%,经过阿里云智能客服的适配性训练后,准确率可以升至90%以上。

 

image.png

 

Table QA技术在客服问答场景开箱落地以后,我们也一直在思考技术接下来的发展方向,多方考虑后还是觉得始终该回归到出发点上。Table QA是基于表格、SQL数据库构建起来的,面向SQL数据库时,除了能够做问答以外,BI智能分析也是十分重要的方向。

 

问答是以SQL数据库为基础来回应客户疑问;BI则是以SQL数据库为基础,洞察其中规律,挖掘有价值信息,为决策提供辅助支撑。所以我们一直希望可以把Table QA能力从客服领域拓展到智能BI分析领域。

 

image.png


当把Table QA技术从问答拓展到智能BI,我们遇到了两个全新的挑战。

 

l 在智能BI分析领域,整个SQL长度过长。如果在问答领域,解析出的SQL是一个句子。那么在智能BI分析领域,解析出的SQL基本是一个段落。

 

l SQL复杂度持续走高。在BI领域,SQL嵌套,仔细查询会变得非常常见。

 

我们的解决策略还是希望能够引入预训练大模型,由此提出Space-T,T代表了table,Space-T把整个问答和BI分析能力进行了统一的大规模预训练;在具体训练机制上,我们提出了TKK训练模型,该模型目前已在EMNLP 2022上正式发表。在Space-T的加持下,加速在智能BI分析领域把Table QA技术进行落地。

 

image.png

 

在BI分析里,最常用的两大类能力,是统计类和同环比趋势类。目前,阿里云智能客服可以在用户输入跨越的过程中,根据表格内容,进行智能化的下拉提示,直接填充表格内容,便于用户快捷操作,也减少了后续解析SQL过程的错误,并直接生成数据饼图。

 

image.png

 

统计类中的同环比趋势方向,生成的SQL相当于一小段文字内容,后台查询到的结果直接以线图的形式进行展现。

 

image.png

 

近年来,阿里云的TableQA技术取得了行业内的技术领先。在三大榜单Spider、SParC、CoSQL中,排名均为第一。

 

在论文研究创新方面,无论是底层的预训练大模型,下游的任务模型,以及上下游模型的执行协同,阿里云智能客服也进行了大规模的体系化创新,发表了多篇论文,

 

截止到今天为止,在这个方向上,我们在全球范围内处于领先水平。

相关文章
|
4天前
|
安全 Java 数据库
即时通讯技术文集(第37期):IM代码入门实践(Part1) [共16篇]
为了更好地分类阅读 52im.net 总计1000多篇精编文章,我将在每周三推送新的一期技术文集,本次是第37 期。
23 2
|
4天前
|
自然语言处理 数据可视化 数据挖掘
首批!瓴羊Quick BI完成中国信通院大模型驱动的智能数据分析工具专项测试
首批!瓴羊Quick BI完成中国信通院大模型驱动的智能数据分析工具专项测试
38 1
|
4天前
|
存储 Java 应用服务中间件
即时通讯技术文集(第36期):《跟着源码学IM》系列专题 [共12篇]
为了更好地分类阅读 52im.net 总计1000多篇精编文章,我将在每周三推送新的一期技术文集,本次是第36期。
20 0
|
4天前
|
人工智能 搜索推荐 算法
人工智能,应该如何测试?(七)大模型客服系统测试
这篇文稿讨论了企业级对话机器人的知识引擎构建,强调了仅靠大模型如 GPT 是不够的,需要专业领域的知识库。知识引擎的构建涉及文档上传、解析、拆分和特征向量等步骤。文档解析是难点,因文档格式多样,需将内容自动提取。文档拆分按语义切片,以便针对性地回答用户问题。词向量用于表示词的关联性,帮助模型理解词义关系。知识引擎构建完成后,通过语义检索模型或问答模型检索答案。测试环节涵盖文档解析的准确性、问答模型的正确率及意图识别模型的性能。整个过程包含大量模型组合和手动工作,远非简单的自动化任务。
262 0
|
4天前
|
存储 缓存 算法
IM技术干货:假如你来设计微信的群聊,你该怎么设计?
微信背后的这个IM群聊系统到底是如何实现的呢?这个问题一直困扰着,于是我决定深入了解一下,看看微信的群聊系统背后的设计是怎样的。
44 1
|
4天前
|
存储 NoSQL Redis
陌陌技术分享:陌陌IM在后端KV缓存架构上的技术实践
在本文中,陌陌数据库负责人冀浩东将聚焦探讨陌陌的 KV 系统架构选型思路,深入解析如何进行此类系统的甄选决策,同时进一步分享陌陌团队在采用 OceanBase(OBKV)过程中所经历的探索与实践经验。
35 0
|
4天前
|
缓存 架构师
即时通讯技术文集(第35期):IM群聊技术合集(Part2) [共12篇]
为了更好地分类阅读 52im.net 总计1000多篇精编文章,我将在每周三推送新的一期技术文集,本次是第35 期。
40 1
|
4天前
|
机器学习/深度学习 自然语言处理
基于深度学习的自然语言处理技术在智能客服系统中的应用
【2月更文挑战第21天】随着人工智能技术的不断发展,自然语言处理(NLP)技术在各个领域得到了广泛应用。本文主要探讨了基于深度学习的自然语言处理技术在智能客服系统中的应用。首先介绍了深度学习和自然语言处理的基本概念,然后分析了智能客服系统的工作原理和技术要求,接着详细阐述了基于深度学习的自然语言处理技术在智能客服系统中的具体应用,包括语义理解、情感分析和问答系统等。最后对基于深度学习的自然语言处理技术在智能客服系统中的优势和挑战进行了总结。
91 1
|
4天前
|
人工智能 自然语言处理 搜索推荐
AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用
全球客服领域的发展设想结合点: 1.智能客服语音助手: 2.多语言无缝服务体验: 3.语音分析与情感智能
823 2
|
4天前
|
人工智能
瓴羊One·客服与AI大模型技术联合打造智能服务新体验
瓴羊One·客服与AI大模型技术联合打造智能服务新体验