美国时间5月9日,Facebook 的人工智能(AI)研究团队宣布,已经开发出一项新的语言翻译技术,翻译速度及准确度均超越谷歌翻译。这项技术再次印证了社交媒体的使命:让世界更开放、更紧密。
语言成为了不同母语的人群间相互交流的障碍,所以突破这层阻拦是社交平台完成使命的必经之路。此前,Facebook可以自动翻译超过45国语言的状态内容,但是Facebook的CEO扎克伯格称“仍有进步空间”。
谷歌机器翻译系统基于循环神经网络(RNN),是老牌翻译系统,已经处于领先地位。但是,微软于2016年12月推出了最新技术,在翻译复杂句型时可以较灵活调整语序,准确度较高。
Facebook的人工智能程师Michael Auli和David Grangier介绍,他们的翻译技术突破在于发挥卷积神经网络(CNN)独特优势,使其性能超越基于RNN的翻译技术。谷歌机器翻译系统是基于RNN,这意味着Facebook翻译速度将是谷歌的9倍。
CNN和RNN是两种神经网络,被用以处理数据序列。RNN是循环分析数据,严格按照句子从左到右的顺序一个字一个字进行翻译。而CNN可以同时从不同角度捕捉数据,更好地契合机器图形处理器(GPU)硬件系统,CNN的特性和GPU的并行计算功能相辅相成。
GPU是为处理视频游戏中的图像而设计的。据彭博社报道,CNN与其的结合意味着用户将有机会在Facebook查阅的每一项内容,都以用户的习惯语言表述,不仅是状态文字,还有视频。
在翻译技术突破方面,另一项杰出表现是使用多跳注意力(multi-hop attention)和门控(gating)来改善翻译效果。注意力机制类似于人在翻译时的断句,系统在翻译时会回看和多次看整个句子来选择下一个翻译的词语,这样更接近人类翻译时的顺序。而多跳注意力是其升华版,利用网络反复回看,做出最符合的翻译。
门控是用来控制神经网络内的信息流动,决定某一特定信息是否可以通过并传输到下一个神经元。在选择下一个翻译的单词时,神经网络会考虑到目前为止所做的翻译。门可以任意放大某一部分的翻译或者整体的大意,以确保接下来选择符合的语境。
目前这项技术还停留在研究阶段,没有完全开发并在Facebook产品上发布。但是,该技术已经应用在翻译状态更新上。
Facebook称已经公开这项翻译资源的源代码,大家可以利用该资源来满足个人翻译需求。除了翻译,这项技术还可以被广泛应用到其他语言类项目。
本文转自d1net(转载)