开发者社区> 知与谁同> 正文

《中国人工智能学会通讯》——2.26 基于深度学习的机器翻译研究进展

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第2章,第2.26节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
+关注继续查看

2.26 基于深度学习的机器翻译研究进展

机器翻译研究如何利用计算机实现自然语言的自动转换,是人工智能和自然语言处理的重要研究领域之一。机器翻译大致可分为理性主义和经验主义两类方法。

基于理性主义的机器翻译方法 , 主张由人类专家通过编纂规则的方式 , 将自然语言之间的转换规律“传授”给计算机。这种方法的主要优点是能够显式描述深层次的语言转换规律。然而,理性主义方法对于人类专家的要求非常高,不仅能够通晓源语言和目标语言,而且需具备一定的语言学和翻译学理论功底,同时熟悉待翻译文本所涉及领域背景知识,还需熟练掌握相关计算机操作技能。这使得研制系统的人工成本高、开发周期长,面向小语种开发垂直领域的机器翻译因人才稀缺而变得极其困难。此外,当翻译规则库达到一定的规模后,如何确保新增的规则与已有规则不冲突也是非常大的挑战。因此,翻译知识获取成为基于理性主义的机器翻译方法所面临的主要挑战。

基于经验主义的机器翻译方法 , 主张计算机自动从大规模数据中“学习”自然语言之间的转换规律。随着互联网文本数据的持续增长和计算机运算能力的不断增强,数据驱动的统计方法从上世纪 90年代起开始逐渐成为机器翻译的主流技术。统计机器翻译为自然语言翻译过程建立概率模型并利用大规模平行语料库训练模型参数,具有人工成本低、开发周期短的优点,克服了传统理性主义方法所面临的翻译知识获取瓶颈问题,因而成为 Google、微软、百度、有道等国内外公司在线机器翻译系统的核心技术。尽管如此,统计机器翻译仍然在以下六个方面面临严峻挑战。

● 线性不可分:统计机器翻译主要采用线性模型,处理高维复杂语言数据时线性不可分的情况非常严重,导致训练和搜索算法难以逼近译文空间的理论上界。

● 缺乏合适的语义表示:统计机器翻译主要在词汇、短语和句法层面实现源语言文本到目标语言文本的转换,缺乏表达能力强、可计算性高的语义表示支持机器翻译实现语义层面的等价转换。

● 难以设计特征:统计机器翻译依赖人类专家通过特征来表示各种翻译知识源。由于语言之间的结构转换非常复杂,人工设计特征难以保证覆盖所有的语言现象。

● 难以充分利用非局部上下文:统计机器翻译主要利用上下文无关的特性设计高效的动态规划搜索算法,导致难以有效将非局部上下文信息容纳在模型中。

● 数据稀疏:统计机器翻译中的翻译规则(双语短语或同步文法规则)结构复杂,即便是使用大规模训练数据,仍然面临着严重的数据稀疏问题。

● 错误传播:统计机器翻译系统通常采用流水线架构,即先进行词法分析和句法分析,再进行词语对齐,最后抽取规则。每一个环节出现的错误都会放大传播到后续环节,严重影响了翻译性能。由于深度学习能够较好地缓解统计机器翻译所面临的上述挑战,基于深度学习的方法自 2013 年之后获得迅速发展,成为当前机器翻译领域的研究热点。基于深度学习的机器翻译大致可以分为两类方法。

● 利用深度学习改进统计机器翻译:仍以统计机器翻译为主体框架,利用深度学习改进其中的关键模块。

● 端到端神经机器翻译:一种全新的方法体系,直接利用神经网络实现源语言文本到目标语言文本的映射。

下面对这两类基于深度学习的机器翻译方法进行简要介绍。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
【人工智能】【深度学习】CUDA与CUDNN安装
【人工智能】【深度学习】CUDA与CUDNN安装
85 0
【报错解决】【人工智能】【深度学习】验证cuda和tensorflow之间的版本对应关系时遇到的问题
【报错解决】【人工智能】【深度学习】验证cuda和tensorflow之间的版本对应关系时遇到的问题
47 0
人工智能(AI)、机器学习(ML)和深度学习(DL):有什么区别?
我们经常交替使用人工智能(AI)、机器学习(ML)和深度学习(DL)这些术语,尽管我们几乎每天都阅读或听到它们。本文解释了这些技术是如何演变的以及它们有何不同。
135 0
RL向左?几何深度学习向右?通往第三代人工智能的理论之路如何走?
RL向左?几何深度学习向右?通往第三代人工智能的理论之路如何走?
159 0
人工智能已到瓶颈!院士“联名”反深度学习,指出AI未来发展方向
  本文约3800字,建议阅读10+分钟。   针对深度学习的技术瓶颈,清华大学张钹等多位院士、教授给出了自己的研究思路。   前言   在刚刚结束的CCF-GAIR大会上,来自清华、加州大学伯克利、斯坦福、哈工大等多所国内外顶级理工科院校的院士齐聚深圳,分享了自己最新的研究。虽然各自研究的细分领域有所不同,但是透过贯穿始终的技术讲演,避不开的事实是,多位院士都在或直接或间接地去“批判”深度学习算法。   演讲中,他们再次明确指出深度学习的缺陷,进而点出,在可以预见的未来里,随着研究的推进,当下的深度学习算法将会逐步被拉下神坛。
306 0
深入了解人工智能和深度学习
深入了解人工智能和深度学习
85 0
当 VR 遇上人工智能最火的“深度学习”,一种新的手势识别技术就诞生了
支持体感交互的VR设备能大大提高虚拟现实体验,不过像HTC Vive这种采用手柄交互的方式,并不能带来更接近现实的操作体验,笔者曾发表过一篇文章《目前主流动作捕捉技术深度解读,HTC Vive 等 VR 设备是如何实体感交互的?》谈到目前主流的交互技术,认为未来采用类似Leap Motion的手势识别技术才是王道。
302 0
2019年上半年收集到的人工智能深度学习方向干货文章
2019年上半年收集到的人工智能深度学习方向干货文章
75 0
人工智能 vs 机器学习 vs 深度学习的区别
人工智能 vs 机器学习 vs 深度学习的区别
67 0
吴恩达NIPS 2016演讲现场直击:如何使用深度学习开发人工智能应用?
当地时间 12 月 5 日,机器学习和计算神经科学的国际顶级会议第 30 届神经信息处理系统大会(NIPS 2016)在西班牙巴塞罗那开幕。大会第一天,百度首席科学家、Coursera 主席兼联合创始人、斯坦福大学 adjunct professor 吴恩达采用手写板书的形式做了一个主题为《使用深度学习开发人工智能应用的基本要点(Nuts and Bolts of Building Applications using Deep Learning)》的 tutorial 演讲。机器之心经授权对吴恩达教授演讲的幻灯片进行了汉化梳理。同时,机器之心特派记者加号也在现场聆听了吴恩达教授的演讲,并将演
93 0
+关注
文章
问答
文章排行榜
最热
最新
相关电子书
更多
深度学习框架实战-Tensorflow
立即下载
TensorRT Introduction
立即下载
端上智能-深度学习模型压缩与加速
立即下载