达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-SPACE-T:从客服迈向智能BI

简介: 达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-


 

image.png

 

表格是各行各业最普遍的结构化数据或知识的存储形式。企业只要有信息化系统,就会有SQL数据库与表格。

 

image.png

 

早在2019年阿里云智能客服就开始进行Table QA的研究与落地。在全球范围来看,都属于最早切入这个方向的研究者和实践落地团队。经过数年打磨,Table QA在阿里云智能客服产品矩阵中大规模落地。

 

我们已经实现多轮对话能力、多表联合查询能力。企业百万行级的数据库可以一次性接入,再大量级的数据库可以做水平扩展;整个开箱准确率达到85%,经过阿里云智能客服的适配性训练后,准确率可以升至90%以上。

 

image.png

 

Table QA技术在客服问答场景开箱落地以后,我们也一直在思考技术接下来的发展方向,多方考虑后还是觉得始终该回归到出发点上。Table QA是基于表格、SQL数据库构建起来的,面向SQL数据库时,除了能够做问答以外,BI智能分析也是十分重要的方向。

 

问答是以SQL数据库为基础来回应客户疑问;BI则是以SQL数据库为基础,洞察其中规律,挖掘有价值信息,为决策提供辅助支撑。所以我们一直希望可以把Table QA能力从客服领域拓展到智能BI分析领域。

 

image.png


当把Table QA技术从问答拓展到智能BI,我们遇到了两个全新的挑战。

 

l 在智能BI分析领域,整个SQL长度过长。如果在问答领域,解析出的SQL是一个句子。那么在智能BI分析领域,解析出的SQL基本是一个段落。

 

l SQL复杂度持续走高。在BI领域,SQL嵌套,仔细查询会变得非常常见。

 

我们的解决策略还是希望能够引入预训练大模型,由此提出Space-T,T代表了table,Space-T把整个问答和BI分析能力进行了统一的大规模预训练;在具体训练机制上,我们提出了TKK训练模型,该模型目前已在EMNLP 2022上正式发表。在Space-T的加持下,加速在智能BI分析领域把Table QA技术进行落地。

 

image.png

 

在BI分析里,最常用的两大类能力,是统计类和同环比趋势类。目前,阿里云智能客服可以在用户输入跨越的过程中,根据表格内容,进行智能化的下拉提示,直接填充表格内容,便于用户快捷操作,也减少了后续解析SQL过程的错误,并直接生成数据饼图。

 

image.png

 

统计类中的同环比趋势方向,生成的SQL相当于一小段文字内容,后台查询到的结果直接以线图的形式进行展现。

 

image.png

 

近年来,阿里云的TableQA技术取得了行业内的技术领先。在三大榜单Spider、SParC、CoSQL中,排名均为第一。

 

在论文研究创新方面,无论是底层的预训练大模型,下游的任务模型,以及上下游模型的执行协同,阿里云智能客服也进行了大规模的体系化创新,发表了多篇论文,

 

截止到今天为止,在这个方向上,我们在全球范围内处于领先水平。

相关文章
|
8月前
|
数据采集 人工智能 搜索推荐
智能新纪元:多模态大模型如何重塑人机交互
智能新纪元:多模态大模型如何重塑人机交互
389 113
|
9月前
|
人工智能 Java API
Java与大模型集成实战:构建智能Java应用的新范式
随着大型语言模型(LLM)的API化,将其强大的自然语言处理能力集成到现有Java应用中已成为提升应用智能水平的关键路径。本文旨在为Java开发者提供一份实用的集成指南。我们将深入探讨如何使用Spring Boot 3框架,通过HTTP客户端与OpenAI GPT(或兼容API)进行高效、安全的交互。内容涵盖项目依赖配置、异步非阻塞的API调用、请求与响应的结构化处理、异常管理以及一些面向生产环境的最佳实践,并附带完整的代码示例,助您快速将AI能力融入Java生态。
1423 12
|
10月前
|
机器学习/深度学习 存储 人工智能
RAG系统文本检索优化:Cross-Encoder与Bi-Encoder架构技术对比与选择指南
本文将深入分析这两种编码架构的技术原理、数学基础、实现流程以及各自的优势与局限性,并探讨混合架构的应用策略。
751 10
RAG系统文本检索优化:Cross-Encoder与Bi-Encoder架构技术对比与选择指南
|
10月前
|
人机交互 API 开发工具
基于通义多模态大模型的实时音视频交互
Qwen-Omni是通义千问系列的全新多模态大模型,支持文本、图像、音频和视频的输入,并输出文本和音频。Omni-Realtime服务针对实时交互场景优化,提供低延迟的人机交互体验。
1747 23
|
8月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
638 0
|
9月前
|
机器学习/深度学习 人工智能 测试技术
探索 Qwen2.5-Max 的智能:大规模 MoE 模型的飞跃
Qwen2.5-Max 是通义实验室推出的最先进MoE模型,在推理、知识和代码任务中表现卓越,已在超20万亿token上预训练,并通过SFT和RLHF优化。在多项基准测试中领先,如Arena-Hard达89.4,MMLU-Pro为76.1,性能超越DeepSeek V3、GPT-4o等模型,成为当前最佳开源模型。可通过Qwen Chat和API使用,适用于开发者、研究者及AI爱好者探索前沿AI能力。
1379 2
|
9月前
|
数据采集 供应链 BI
观远数据 BI:多链路复杂数据处理与智能任务调度,驱动企业敏捷决策
观远数据BI具备多链路复杂数据处理与智能任务调度能力,支持多源数据融合、零代码清洗建模及自动化调度,助力企业打破数据孤岛,实现零售、金融、央国企等场景的实时决策与降本增效。
|
11月前
|
数据采集 人工智能 自然语言处理
通义灵码支持 Qwen3-Coder,带你玩转 Agentic Coding,免费不限量
欢迎大家在通义灵码里免费体验最新 Qwen3-Coder 模型,一起 AI Coding。
|
11月前
|
人工智能 BI 语音技术
AR眼镜+AI大模型:颠覆工业设备验收流程的智能革命
本方案结合AR眼镜与AI视觉大模型,打造高效、精准、可追溯的设备验收流程。通过第一视角记录、智能识别、结构化数据生成与智能报表功能,提升验收效率与质量,助力企业实现智能化管理。

热门文章

最新文章