《中国人工智能学会通讯》——2.27 利用深度学习改进统计机器翻译

本文涉及的产品
语种识别,语种识别 100万字符
文本翻译,文本翻译 100万字符
图片翻译,图片翻译 100张
简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第2章,第2.27节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

2.27 利用深度学习改进统计机器翻译

利用深度学习改进统计机器翻译的核心思想是以统计机器翻译为主体,使用深度学习改进其中的关键模块,如语言模型[1] 、翻译模型 [2] 、调序模型 [3] 、词语对齐[4]等。

深度学习能够帮助机器翻译缓解数据稀疏问题。以语言模型为例。语言模型能够量化译文的流利度,对译文的质量产生直接的重要影响,是机器翻译中的核心模块。传统的语言模型采用 n-gram方法,通过极大似然估计训练模型参数。由于这种方法采用离散表示(即每个词都是独立的符号),极大似然估计面临着严重的数据稀疏问题:大多数n-gram 在语料库上只出现一次,无法准确估计模型参数。因此,传统方法不得不使用平滑和回退等策略来缓解数据稀疏问题。但即使采用平滑和回退策略,统计机器翻译系统还是因为数据过于稀疏而无法捕获更多的历史信息,通常仅能使用 4-gram或者 5-gram 语言模型。

深度学习著名学者、加拿大蒙特利尔大学Yoshua Bengio 教授在 2003 年率先提出基于神经网络的语言模型[5] ,通过分布式表示(即每个词都是连续、稠密的实数向量)有效缓解了数据稀疏问题。美国 BBN 公司的 Jacob Devlin 等人于 2014年进一步提出神经网络联合模型(Neural NetworkJoint Models) [1] 。传统的语言模型往往只考虑目标语言端的前 n-1 个词。以图 1 为例,假设当前词是“the”,一个 4-gram 语言模型只考虑之前的三个词:“get”、“will”和“i”。Jacob Devlin 等人认为,不仅仅是目标语言端的历史信息对于决定当前词十分重要,源语言端的相关部分也起着关键作用。因此,其神经网络联合模型额外考虑五个源语言词,即“就”、“取”、“钱”、“给”和“了”。由于使用分布式表示能够缓解数据稀疏问题,神经网络联合模型能够使用丰富的上下文信息(图 1 共使用了 8 个词作为历史信息),从而相对于传统的统计机器翻译方法获得了显著的提升(BLEU 值提高约 6 个百分点),因此获得了自然语言处理领域重要国际会议 ACL 2014 的最佳论文奖。
image

对机器翻译而言,使用神经网络的另一个优点是能够解决特征难以设计的问题。以调序模型为例。基于反向转录文法的调序模型[6]是基于短语的统计机器翻译的重要调序方法之一,其基本思想是将调序视作二元分类问题:将两个相邻源语言词串的译文(1)顺序拼接或(2)逆序拼接。传统方法通常使用最大熵分类器,但是如何设计能够捕获调序规律的特征成为难点。由于词串的长度往往非常长,如何从众多的词语集合中选出能够对调序决策起到关键作用的词语是非常困难的。因此,基于反向转录文法的调序模型不得不仅基于词串的边界词设计特征[6] ,无法充分利用整个词串的信息。利用神经网络能够缓解特征设计的问题,首先利用递归自动编码器(Recursive Autoencoders)生成词串的分布式表示;然后基于四个词串的分布式表示建立神经网络分类器[3] 。因此,基于神经网络的调序模型不需要人工设计特征就能够利用整个词串的信息,显著提高了调序分类准确率和翻译质量。实际上,深度学习不仅能够为机器翻译生成新的特征[1-2] ,还能够将现有的特征集合转化生成新的特征集合[7] ,显著提升了翻译模型的表达能力。

然而,尽管利用深度学习改进统计机器翻译取得了显著的效果,但仍然面临以下难题。

● 线性不可分:整体框架仍是线性模型,高维数据线性不可分的情况依然存在。虽然可以在保持特征不变的情况下将线性模型替换为非线性模型[8] ,但目前尚未获得大幅度的提升。

● 非局部特征:通过深度学习引入的新特征往往是非局部的,导致无法设计高效的动态规划算法,从而不得不采用在后处理阶段进行超图重排序等近似技术[9] 。

能不能直接利用神经网络进行机器翻译呢?

相关文章
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】Python之人工智能应用篇——音频生成技术
音频生成是指根据所输入的数据合成对应的声音波形的过程,主要包括根据文本合成语音(text-to-speech)、进行不同语言之间的语音转换、根据视觉内容(图像或视频)进行语音描述,以及生成旋律、音乐等。它涵盖了声音结构中的音素、音节、音位、语素等基本单位的预测和组合,通过频谱逼近或波形逼近的合成策略来实现音频的生成。 音频生成技术的发展主要依赖于深度学习模型,如循环神经网络(RNN)、长短时记忆网络(LSTM)、Transformer等。这些模型通过学习大量的音频数据,能够自动生成与人类发音相似甚至超越人类水平的音频内容。近年来,随着大规模预训练模型的流行,如GPT系列模型、BERT、T5等,
12 7
【深度学习】Python之人工智能应用篇——音频生成技术
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
探索人工智能的未来:深度学习的突破与挑战
【8月更文挑战第17天】本文将深入探讨人工智能的一个关键分支——深度学习,揭示其背后的原理、当前的研究热点以及未来可能遇到的挑战。我们将从深度学习的基础概念出发,逐步展开讨论,最后提出一个开放性问题,引发读者对未来技术发展的思考。
20 12
|
2天前
|
机器学习/深度学习 人工智能 算法
【深度学习】python之人工智能应用篇——图像生成技术(二)
图像生成是计算机视觉和计算机图形学领域的一个重要研究方向,它指的是通过计算机算法和技术生成或合成图像的过程。随着深度学习、生成模型等技术的发展,图像生成领域取得了显著的进步,并在多个应用场景中发挥着重要作用。
15 9
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习的奥秘:探索人工智能的未来之路
本文深入探讨了深度学习技术的核心原理及其在人工智能领域的应用。通过浅显易懂的语言和生动的比喻,我们将一窥深度学习如何模仿人脑处理信息,以及这项技术如何推动自动驾驶汽车、医疗诊断和自然语言处理等领域的创新。文章旨在为初学者提供一个清晰的深度学习入门视角,同时为有一定基础的读者展现深度学习的未来发展潜力。
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】python之人工智能应用篇——视频生成技术
视频生成技术是一种基于深度学习和机器学习的先进技术,它使得计算机能够根据给定的文本、图像、视频等单模态或多模态数据,自动生成符合描述的、高保真的视频内容。这种技术主要依赖于深度学习模型,如生成对抗网络(GAN)、自回归模型(Auto-regressive Model)、扩散模型(Diffusion Model)等。其中,GAN由两个神经网络组成:一个生成器用于生成逼真的图像或视频,另一个判别器用于判断生成的图像或视频是否真实。通过不断的对抗学习,生成器和判别器共同优化,以产生更高质量的视频。
10 2
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】python之人工智能应用篇--跨模态生成技术
跨模态生成技术是一种将不同模态的数据(如文本、图像、音频、视频等)进行融合和转换的技术。其目标是通过将一个模态的数据作为输入,生成与之对应的另一个模态的输出。这种技术对于突破单一模态的局限性,提高信息处理的准确性和丰富性具有重要意义。跨模态生成技术主要依赖于深度学习和生成模型,通过学习和模拟不同模态之间的映射关系来实现模态间的转换。
6 1
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】自然语言处理(NLP)的突破,关注NLP在机器翻译、情感分析、聊天机器人等方面的最新研究成果和应用案例。
自然语言处理(NLP)作为人工智能的一个重要分支,近年来取得了显著的突破,特别在机器翻译、情感分析、聊天机器人等领域取得了显著的研究成果和广泛的应用。以下是对这些领域最新研究成果和应用案例的概述,并附带相应的代码实例。
5 1
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
探索人工智能的未来:深度学习的新篇章
【8月更文挑战第16天】在这篇文章中,我们将深入探讨深度学习如何推动人工智能的未来发展。我们将分析深度学习的基本原理,以及它如何改变我们处理数据和解决问题的方式。文章将通过具体实例来展示深度学习在各个领域的应用,包括医疗保健、自动驾驶汽车和自然语言处理等。最后,我们将探讨深度学习面临的挑战和未来可能的发展方向。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
|
5天前
|
机器学习/深度学习 人工智能 算法
AI人工智能(ArtificialIntelligence,AI)、 机器学习(MachineLearning,ML)、 深度学习(DeepLearning,DL) 学习路径及推荐书籍
AI人工智能(ArtificialIntelligence,AI)、 机器学习(MachineLearning,ML)、 深度学习(DeepLearning,DL) 学习路径及推荐书籍
13 0