2.29 未来展望
综上所述,机器翻译研究 60 多年来的发展趋势是不断降低人在翻译过程中主导作用:基于规则的方法完全靠人编纂翻译规则;基于统计的方法能够从数据中自动学习翻译知识,但仍需要人来设计翻译过程的隐结构和特征;基于深度学习的方法则可以直接用神经网络描述整个翻译过程。近年来,端到端神经机器翻译成为最热门的研究领域,未来的研究方向可能集中在以下五个方面。
● 架构:如何设计表达能力更强的新架构?近期提出的神经网络图灵机[15]和记忆网络[16]可能成为下一个关键技术。
● 训练:如何降低训练复杂度?如何更有效地提高翻译质量?近期的工作表明直接优化评价指标能够显著提升翻译性能[17-18] 。
● 先验知识:目前的方法完全从数据中自动学习翻译知识,能否利用先验知识指导翻译过程?能否与现有的知识库相结合?近期在基于注意力的翻译模型上的研究工作已经有一些初步进展[19] 。
● 多语言:目前的方法主要处理中文和英文等资源丰富语言,能否处理更多的语言对? Bengio研究组提出的基于共享注意力机制的多语言翻译方法值得关注[20] 。
● 多模态:目前的方法主要关注文本翻译,能否利用向量表示贯通文本、语音和图像,实现多模态翻译?最近在图像标题翻译上的研究工作是很好的尝试[21] 。
相信未来几年,基于深度学习的机器翻译方法尤其是端到端神经机器翻译会取得更大突破,发展成为新时期机器翻译的主流技术,造福于社会大众。