阿里智能音箱发布前夕,首次公布自然语言处理成果

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: 阿里巴巴AI Labs 将在7月5日发布第一款智能音箱设备的消息引发了国内极大的关注,但读者们不仅不熟悉阿里巴巴AI Labs,对阿里自然语言处理方面的成果是不是也不理解?这篇文章介绍了阿里巴巴被国际数据挖掘顶会KDD2017收录的一篇自然语言处理(NLP)的相关论文《一种新的语义编码模型及其在智能问答及分类中的应用》。


上周,关于阿里巴巴成立 AI Labs 的消息不胫而走。事实上,该机构在 2016 年低调成立,主要负责阿里巴巴集团旗下消费级 AI 产品研发,与 iDST 的定位有所区别。从机器之心收到的发布会邀请函及其他公开消息看,7 月 5 日,该机构将发布第一款实体产品智能音箱设备,它能够理解中文语音指令,还能让阿里巴巴的用户在淘宝上购物,短期内仅面向中国市场发售。

 

与此同时,这次为阿里巴巴智能音箱提供技术支持的团队也首次曝光了其自然语言处理成果。一篇自然语言处理(NLP)的相关论文《一种新的语义编码模型及其在智能问答及分类中的应用》被国际数据挖掘顶会 KDD2017 收录。在自然语言处理的两个核心应用场景------文本分类和智能问答上,阿里巴巴这套「即刻唤醒,即刻识别」神经网络模型的智能问答准确率相比微软的 wikiqa 数据集和 IBM 的 insuranceqa 数据集提升了 2-4%,是目前业内最高水准。

 

该论文的作者、阿里巴巴人工智能实验室资深算法工程师王成龙对机器之心谈到这项技术的挑战,「初期相关模型训练所需的语料较缺乏,在开发的同时,我们积累起来一批独有、海量的中文语料,有力支持了我们的模型训练。神经网络模型的计算复杂度比较高,性能问题是线上应用的一个主要瓶颈,这一方面,我们针对神经网络模型的线上部署做了很多的优化工作,保证在大并发请求下依赖能有较好的性能。」

 

另一方面,基于神经网络的 NLP 方法都依赖分词,英文的分词是天然的,而中文是以「字」为单位,这也使新品技术开发的难度有所提高。王成龙说:「英文的句子结构则更加清晰,而汉语重意合而不重形式,句子结构比较松散,中文相关标准语料集的缺失也是一大瓶颈。」


微信图片_20211129093129.jpg

KDD 2017 将于今年 8 月 13 日召开


微信图片_20211129093133.jpg

阿里巴巴收到 KDD2017 的邀请邮件


论文显示,阿里巴巴研发了一款名为 conv-RNN 的通用推理混合框架,用于文本的语义建模,无缝集成了从卷积和循环神经网络结构中提取语言信息的不同方面的优点从而加强新框架的理解力。可有效甄别用户的对话意图,自主决策对话中的策略,实现「自然语言无缝理解,跨领域自由切换」。


微信图片_20211129093139.jpg

阿里巴巴首创的 conv-RNN 混合框架


业界普遍认为,自然语言处理是人工智能中最难的部分,也是决定 AI 是否「智能」的关键因素。王成龙在接受机器之心采访时说,阿里巴巴在语音交互技术方面已经深耕多年,并已在多类产品中应用。」


针对这篇论文,该团队向机器之心发布了独家技术解读:


语义编码的意义


自然语言这一被人类发明的信号系统,通常被我们归为一种「非结构化数据」。其原因在于,自然语言文本是由一堆符号(token)顺序拼接而成的不定长序列,很难直接转变为计算机所能理解的数值型数据,因而无法直接进行进一步的计算处理。语义编码的目标即在于如何对这种符号序列进行数值化编码,以便于进一步地提取和应用其中所蕴含的丰富信息。语义编码是所有自然语言处理(Natural Language Processing,NLP)工作的「第一步「,同时也很大程度地决定了后续应用的效果。


传统的文本编码方式通常将其当作离散型数据,即将每个单词(符号)作为一个独立的离散型数值,如 Bag-of-Words (BOW)、TF-IDF 等。但是这类方法忽略了单词与单词之间的语义关联性,同时也难以对单词的顺序及上下文依赖信息进行有效编码。近几年,深度学习技术被广泛的应用于 NLP 领域,并在众多算法命题上取得了突破。其本质在于,深度神经网络在特征提取(语义编码)上具有极大的优势。

已有方法的瓶颈


当前,较为常用的文本语义编码模型包括循环神经网络(Recurrent Neural Network,RNN)以及卷积神经网络(Convolution Neural Network,CNN)。


微信图片_20211129093145.jpg


循环神经网络是应用最为广泛的序列数据神经网络建模方法。相对于传统的前向神经网络,循环神经网络的主要特点在于,在每个时刻,其输出不仅要依赖于当前时刻的输入,还要考虑上一时刻的模型「状态」。通过对历史状态的依赖,RNN 模型能够有效的表征文本数据的上下文依存信息。但是,RNN 的「宏伟目标」-有效管理任意跨度的信息传递-往往使得其难以有效的训练,进而也限制了其在具体应用中的效果。


微信图片_20211129093148.jpg


另一被广泛应用的语义编码模型是 CNN 模型。传统的 CNN 建模通常用于解决图像的特征提取。但近年来,众多学者尝试将其应用到文本处理领域。CNN 的模型结构来源于对人类视觉神经信号处理机制的模拟。与文本数据不同的是,图像数据通常被看做一个二维数据结构,而相应的 CNN 模型也更适于提取其中的「局部」特征。但与图像数据相似的是,文本数据中的上下文依赖通常可以被简化为一种「局部」信息,即传统 NLP 领域中的 N-gram 语言模型:文本中一个词的具体含义,通常只和上文有限距离内的几个词相关。因此,CNN 中的「局部卷积信息处理机制同样可以应用于文本数据中,用于提取文本中的 N-gram 特征。但是,与图像信息不同的是,文本数据中的上下文依赖关系有可能会经历一个很长的跨度。而 CNN 只能对固定范围内的局部依存关系进行建模。因此,CNN 语义编码方法也存在一定的缺陷。


Conv-RNN


微信图片_20211129093152.jpg


近期,我们团队与数据技术及产品部兄弟团队共同投稿一篇 KDD 文章,其中我们提出了一种新的文本语义编码算法 conv-RNN(如图 2 所示)。该模型在参考了循环神经网络与卷积神经网络的同时,进行了进一步的文本语义编码优化。conv-RNN 不仅保留了 RNN 模型对不定长跨度的上下文依赖的编码能力,还利用了 CNN 模型中常用的最大池化机制,用以更加简洁地从文本数据所蕴含的丰富信息中抽离出不同的信息表征。此外,在 conv-RNN 的基础上,我们还提出了一种新的智能问答(answer selection)模型以及文本分类(sentence classification)模型。为了充分验证所提出的模型的效果,我们分别选取了智能问答及文本分类领域的一批标准数据集,与当前业界的最新成果进行了对比验证。


智能问答


微信图片_20211129093156.jpg


智能问答是当前比较火的一个 NLP 应用领域,也被认为是 NLP 研究最有可能于近期实现商业化落地的一个领域。在 conv-RNN 语义编码算法基础之上,我们进一步提出了一种新的问答匹配模型。此外,在该模型中,我们还引入了一种「权值共享」机制以及 attention 方法,用以进一步提升 question-answer 匹配效果。


微信图片_20211129093201.jpg

微信图片_20211129093401.jpg


我们选用了微软发布的 WikiQA 数据集以及 IBM 发布的 InsuranceQA 数据集用来对比所提出的模型与业界的 state-of-the-art 方法,以验证该模型的有效性。由结果可知,在 WikiQA 数据集上,conv-RNN 击败了所有 state-of-the-art 方法,并且在 MAP(mean average precision)和 MRR(mean reciprocal rank)两个指标上均取得了较大的提升。在 InsuranceQA 数据集上,conv-RNN 在 dev 和 test2 两个测试集上均取得了较大的提升,仅在 test1 上略低于 AP-BILSTM。


文本分类


微信图片_20211129093204.jpg


在 conv-RNN 的基础上,我们进一步提出了一种新的文本分类模型(如图 4 所示)。为了验证该模型的有效性,我们选取了业界常用的 5 个标准的分类数据集:Movie Review(MR);Stanford Sentiment Treebank-1(SST-1);Stanford Sentiment Treebank-2(SST-2);Subj;IMDB。由对比结果可知,conv-RNN 在前 4 个数据集上均超越了各类 state-of-the-art 方法。


微信图片_20211129093209.jpg


总结


语义编码技术是所有 NLP 工作的基础,也是当前 NLP 技术进一步发展的主要「瓶颈」所在。我们在语义理解以及更上层的智能问答、多轮人机交互方向已经有了一定的技术积累,后续还会继续在这一方向发力,以期能够尽快做出为大众服务的人工智能产品。微信图片_20211129092521.png

相关文章
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
springboot基于人工智能和自然语言理解技术的医院智能导医系统源码
智能导诊系统可为患者提供线上挂号智能辅助服务,患者根据提示手动输入自己的基本症状,通过智能对话方式,该系统会依据大数据一步步帮助患者“诊断”,并最终推荐就医的科室和相关专家。患者可自主选择,实现“一键挂号”。这一模式将精确的导诊服务前置,从源头上让医疗服务更高效。
470 2
|
人工智能 自然语言处理 机器人
智能电话机器人核心技术:自然语言处理
什么是自然语言处理? 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向.它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法.自然语言处理是一门融语言学、计算机科学、数学于一体的科学.因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别. 自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统.因而它是计算机科学的一部分. 自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域.
|
2月前
|
自然语言处理 API C++
阿里通义推出SmartVscode插件,自然语言控制VS Code,轻松开发应用,核心技术开源!
SmartVscode插件深度解析:自然语言控制VS Code的革命性工具及其开源框架App-Controller
|
机器学习/深度学习 自然语言处理 达摩院
通义大模型:打造更智能、更灵活的自然语言处理技术
大家好,今天我想向大家介绍一款备受瞩目的自然语言处理技术——通义大模型。作为一种基于深度学习的人工智能技术,通义大模型能够模拟人类的思维方式,实现更智能、更灵活的自然语言处理,为我们的生活和工作带来了极大的便利。
685 2
通义大模型:打造更智能、更灵活的自然语言处理技术
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】自然语言处理(NLP)的突破,关注NLP在机器翻译、情感分析、聊天机器人等方面的最新研究成果和应用案例。
自然语言处理(NLP)作为人工智能的一个重要分支,近年来取得了显著的突破,特别在机器翻译、情感分析、聊天机器人等领域取得了显著的研究成果和广泛的应用。以下是对这些领域最新研究成果和应用案例的概述,并附带相应的代码实例。
194 1
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
智能时代的桥梁:自然语言处理技术在人工智能中的应用
随着人工智能技术的飞速发展,自然语言处理(NLP)作为其核心领域之一,已广泛应用于多个行业。本文将深入探讨NLP的基本概念、关键技术以及其在现代AI系统中的应用实例,旨在揭示NLP如何成为连接人类与机器的桥梁,推动智能技术向前迈进。
108 1
|
8月前
|
机器学习/深度学习 编解码 自然语言处理
如何评价深度学习在自然语言处理、计算机视觉等领域的应用成果?
【5月更文挑战第3天】如何评价深度学习在自然语言处理、计算机视觉等领域的应用成果?
120 6
|
8月前
|
机器学习/深度学习 数据采集 人工智能
基于深度学习的自然语言处理技术在智能问答系统中的应用
随着人工智能技术的飞速发展,自然语言处理(NLP)已成为连接人类与机器的桥梁。本文深入探讨了深度学习在自然语言处理领域中的应用,尤其是其在构建智能问答系统中的作用。通过对现有技术的剖析与最新研究成果的整合,文章展示了如何利用循环神经网络(RNN)、长短期记忆网络(LSTM)以及注意力机制等深度学习模型来提高问答系统的理解能力和响应质量。本研究不仅关注模型的架构创新,也着重于数据处理、模型训练和优化策略等实践细节,力求为读者提供一个全面而深刻的技术视角。
|
8月前
|
机器学习/深度学习 自然语言处理 机器人
【Tensorflow+自然语言处理+LSTM】搭建智能聊天客服机器人实战(附源码、数据集和演示 超详细)
【Tensorflow+自然语言处理+LSTM】搭建智能聊天客服机器人实战(附源码、数据集和演示 超详细)
810 10
|
8月前
|
自然语言处理 机器人 数据库
【Python自然语言处理+tkinter图形化界面】实现智能医疗客服问答机器人实战(附源码、数据集、演示 超详细)
【Python自然语言处理+tkinter图形化界面】实现智能医疗客服问答机器人实战(附源码、数据集、演示 超详细)
240 4

热门文章

最新文章