对话智能的前沿研究和大规模应用云讲座

简介: 5月29日,应复旦大学计算机学院赵卫东老师的邀请,阿里巴巴达摩院资深算法专家李永彬老师为复旦学子开展了一场深入精彩的“对话智能的前沿研究和大规模应用”云讲座,复旦软件学院近百名研究生聆听了讲座。

讲座聚焦对话智能,介绍了达摩院在对话智能方面实施的技术方案以及大规模应用。依托丰富的实施经验和多年的技术沉淀,达摩院对话智能在自然语言理解、多轮对话管理、智能问答、多模态对话等多个领域取得了不错的效果,其智能客服机器人已经大规模应用于金融、政务、医疗、运营商等多个行业。
李永彬老师以2020年1月疫情爆发初期达摩院研发的“疫情防控智能服务平台”为例,生动讲述了对话智能的难点和解决难点的技术。“疫情防控智能服务平台”包含疫情智能外呼、疫情文本智能机器人、热线智能导航等功能,可以解答“温州北高速收费站是否可以通行”等问题,可以帮助卫健委疾控部门对与确诊病例同乘交通工具的人员开展14天跟踪排查,服务于全国57个城市,累积外呼1600万,多轮对话完成率90%以上,成为全国最大的智能外呼平台。

疫情防控智能服务平台在搭建过程中存在三个难点:一是如何解决低资源小样本下的理解问题;二是如何解决带推理的深层语义理解问题;三是如何让规则化的多轮对话管理具备数据学习能力问题。
针对如何解决低资源小样本下的理解问题,达摩院首次将Few-shot learning小样本学习技术引用到对话系统。小样本学习技术适用于场景应用具体但训练样本少的情况。其训练过程是从庞大的数据集中每次采样较少的类,每个类采样K个样本(小样本)构成训练集,从剩余样本中构建测试集,由此形成元任务进行分类学习。小样本能够训练的关键在于整个数据集数量庞大,虽然每轮训练的样本少,但可训练的轮数多,因此小样本训练模型具有强大的泛化能力。该技术初期用于图像领域包括孪生网络、匹配网络、原型网络、关系网络等,达摩院将小样本学习在图像领域的应用总结提炼出“编码—归纳—关系”的框架,把样本数据编码为样本表示,再结合语义归纳为类表示,最后根据语义关系计算得到结果。

为了解决自然语言处理在归纳能力和记忆能力方面效果不佳的问题,达摩院提出归纳机制,引入胶囊网络的表达方式和动态路由的计算算法,构建从“样本表示”到更抽象的“类表示”的归纳机制。在记忆能力方面,达摩院提出动态记忆机制,设计出动态记忆方法使用全局记忆来解决小样本遗忘问题,设计寻找增强归纳方法对寻找要素进行样本匹配,找出最相关的样本,解决样本多样性难归纳的问题。实验表明,归纳机制和动态记忆机制在英文公开数据集和中文意图分类数据集上都取得了最好效果。

针对如何解决带推理的深层语义理解问题,达摩院设计了CoAMR Parsing算法深层次理解语义。鉴于AMR抽象语义表示体系的特点——以概念为中心便于对语义进行抽象和后续理解,具有相对完整的语义关系体系,达摩院吸收了AMR的优点,设计了面向人机对话的抽象语义表示CoAMR,同时简化修改通用概念以及建立核心关系和非核心关系的语义体系,解决了AMR模型复杂的问题。在对具体场景数据进行标识的基础上,使用CoAMR模型进行深层语义的训练。

针对如何让规则化的多轮对话管理具备数据学习能力的问题。达摩院发现,多轮对话训练的核心难点在于训练数据获取难、标注难。因此在数据获取方面,达摩院引入用户模拟器,使得对话机器人和用户模拟器互相对话,两个机器在对话中产生大量的标注数据,突破了数据约束。在数据标注方面,引入多场景知识迁移模型,实现了对话管理模型的迁移学习,在小样本模型下效果提升4-5个百分点。

最后,李永彬老师分析了对话智能的未来研究趋势。李永彬老师分析认为,未来对话智能领域有七大研究方向:预训练对话模型、多引擎统一对话、多模态对话、对话式营销、复杂推理能力、符号知识和神经网路机制的融合、终身学习的对话智能系统。

本次讲座技术内容丰富,兼具技术理论的前沿性和工业应用的实践性,抓住当前自然语言处理的难点和技术处理路线进行了详细分析,同学们纷纷表示收获很大,并对感兴趣的问题与李永彬老师进行了互动交流(彭文文录)。

无标题.jpg

目录
相关文章
|
Web App开发 编解码 JavaScript
Flutter Web:图片相关及跨域问题
在flutter web上也可以使用Image这个widget来加载显示图片。但是涉及到网络图片的时候就可能会出现问题,现象是不显示图片,控制台报错:
2102 0
|
10月前
|
存储 C语言 C++
【c语言】运算符汇总(万字解析)
今天博主跟大家分享了c语言中各种操作符的功能、使用方法以及优先级和结合性,并且与大家深入探讨了表达式求值的两个重要规则--算数转换和整形提升。学习这些知识对我们的C语言和C++学习都有着极大的帮助。
530 2
|
10月前
|
弹性计算 监控 负载均衡
|
5月前
|
安全 数据建模 物联网
关于IP SSL证书的9大常见问题解答
IP SSL证书用于实现IP地址的HTTPS加密,确保数据传输安全。它分为DV型和OV型企业型,支持单个或多个IP地址保护。常见问题包括:什么是IP SSL证书、其作用与类型、签发机构、内网申请可行性、应用场景、价格范围、申请条件与流程等。锐安信sslTrus和CFCA等品牌支持内网IP加密,价格从几百到几千元不等。申请需确认型号、生成CSR文件并提交验证。
|
5月前
|
缓存 弹性计算 网络协议
阿里云服务器对接高防的时候可能会出现的问题
本文总结了高防服务使用中常见的六大类问题及其解决方法,包括网络延迟与跨运营商访问异常、安全组配置错误、后端服务器异常、高防服务状态异常、端口协议配置错误及其他常见问题。针对每类问题,文章分析了可能的原因,并提供了具体排查和解决方案,如选择合适防护节点、放行回源IP段、优化服务器性能、调整防护策略等,帮助用户快速定位并解决问题,提升服务稳定性。
|
8月前
|
编解码 人工智能 算法
国家扶持超高清产业背景下:视频云AIGC的超高清技术实践
本次分享由阿里云视频云高级产品解决方案架构师陈震主讲,聚焦国家扶持超高清产业背景下,视频云AIGC的超高清技术实践。内容涵盖超高清产业发展趋势与挑战、阿里视频云的应对方案及应用案例。通过全链路超高清解决方案,结合AI、云计算等技术,提供从内容生产、传输到播放的完整支持,助力行业应对超高清视频带来的技术与市场挑战。
307 0
|
Linux API 开发者
【专栏】掌握`curl`能提升开发效率和解决问题的能力
【4月更文挑战第28天】本文介绍了如何使用`curl`命令从GitHub下载文件。基础操作包括获取文件的克隆URL,打开终端输入`curl -O <file_clone_url>`,执行命令以下载文件。文章还提及了代理设置、认证和错误处理等高级应用,帮助开发者更高效地管理代码和资源。掌握`curl`能提升开发效率和解决问题的能力。
377 4
|
10月前
|
Docker 微服务 容器
使用Docker Compose实现微服务架构的快速部署
使用Docker Compose实现微服务架构的快速部署
256 1
|
11月前
|
安全 数据安全/隐私保护
如何使用贝锐花生壳DDNS,实现OA、ERP、CRM等办公系统远程访问?
在现代企业运营中,员工出差和分支机构的协同工作日益增多,确保不同地点员工安全便捷地访问公司内网的BS架构办公系统成为挑战。贝锐花生壳内网穿透服务提供了一种无需公网IP、无需复杂配置的解决方案,通过简单的三步设置,即可实现高效、安全的远程访问,支持多种主流办公系统。
322 10
|
11月前
|
Java 编译器 开发者
Java中的异常处理机制:从基础到进阶
本文深入探讨Java编程语言中的异常处理机制,从基础知识出发,逐步解析异常的分类、捕获和处理方法。通过实际案例分析,展示如何在开发过程中有效利用异常处理提高代码的稳定性和可维护性。进一步探讨了自定义异常的创建和使用场景,以及在Java中进行异常处理的最佳实践。文章旨在为Java开发者提供一个全面而详细的异常处理指南,帮助开发者更好地理解和运用Java的异常处理机制。
183 2