Facebook翻译革命性突破 速度是谷歌的9倍更准确

简介:

美国时间5月9日,Facebook 的人工智能(AI)研究团队宣布,已经开发出一项新的语言翻译技术,翻译速度及准确度均超越谷歌翻译。这项技术再次印证了社交媒体的使命:让世界更开放、更紧密。

语言成为了不同母语的人群间相互交流的障碍,所以突破这层阻拦是社交平台完成使命的必经之路。此前,Facebook可以自动翻译超过45国语言的状态内容,但是Facebook的CEO扎克伯格称“仍有进步空间”。

谷歌机器翻译系统基于循环神经网络(RNN),是老牌翻译系统,已经处于领先地位。但是,微软于2016年12月推出了最新技术,在翻译复杂句型时可以较灵活调整语序,准确度较高。

Facebook的人工智能程师Michael Auli和David Grangier介绍,他们的翻译技术突破在于发挥卷积神经网络(CNN)独特优势,使其性能超越基于RNN的翻译技术。谷歌机器翻译系统是基于RNN,这意味着Facebook翻译速度将是谷歌的9倍。

CNN和RNN是两种神经网络,被用以处理数据序列。RNN是循环分析数据,严格按照句子从左到右的顺序一个字一个字进行翻译。而CNN可以同时从不同角度捕捉数据,更好地契合机器图形处理器(GPU)硬件系统,CNN的特性和GPU的并行计算功能相辅相成。

GPU是为处理视频游戏中的图像而设计的。据彭博社报道,CNN与其的结合意味着用户将有机会在Facebook查阅的每一项内容,都以用户的习惯语言表述,不仅是状态文字,还有视频。

在翻译技术突破方面,另一项杰出表现是使用多跳注意力(multi-hop attention)和门控(gating)来改善翻译效果。注意力机制类似于人在翻译时的断句,系统在翻译时会回看和多次看整个句子来选择下一个翻译的词语,这样更接近人类翻译时的顺序。而多跳注意力是其升华版,利用网络反复回看,做出最符合的翻译。

门控是用来控制神经网络内的信息流动,决定某一特定信息是否可以通过并传输到下一个神经元。在选择下一个翻译的单词时,神经网络会考虑到目前为止所做的翻译。门可以任意放大某一部分的翻译或者整体的大意,以确保接下来选择符合的语境。

目前这项技术还停留在研究阶段,没有完全开发并在Facebook产品上发布。但是,该技术已经应用在翻译状态更新上。

Facebook称已经公开这项翻译资源的源代码,大家可以利用该资源来满足个人翻译需求。除了翻译,这项技术还可以被广泛应用到其他语言类项目。

本文转自d1net(转载)

相关文章
|
6月前
|
Linux 语音技术
FaceBook推出新的翻译模型Seamless!可实现跨语言交流的无缝衔接!
FaceBook推出新的翻译模型Seamless!可实现跨语言交流的无缝衔接!
155 0
|
编解码 人工智能 前端开发
Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读
Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读
Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读
|
监控 安全 数据挖掘
苹果封杀谷歌、Facebook:科技巨头涉嫌收集用户隐私数据
在封杀了 Facebook 之后,昨天苹果又宣布关闭谷歌的内部 iOS 应用分发权限。目前测试版本的谷歌地图、环聊(Hangouts)、Gmail 等程序已经无法在苹果手机上运行了,此外那些只对谷歌员工开放的内部应用程序,如用来坐班车的 Gbus 和点餐 app 也已无法使用。
178 0
苹果封杀谷歌、Facebook:科技巨头涉嫌收集用户隐私数据
「镁客早报」Facebook再曝数据漏洞;分析师预测谷歌亚马逊明年将推出AirPods竞品
因为一个漏洞,Facebook上有680万用户的私人照片被暴露给不应该看到它们的应用程序。
416 0
|
新零售 人工智能 达摩院
Facebook AI 翻译主管黄非加盟阿里达摩院
日前,黄非博士入职阿里巴巴达摩院。他以前的身份是:Facebook(脸书)应用机器学习部AI翻译团队主管。在达摩院机器智能技术实验室,他将和同事推动AI翻译在新零售、跨境电商、视频等领域的实时翻译应用。
2332 0
【数据通天塔来了】谷歌、Facebook、微软、推特四巨头联手,打通全球数据壁垒!
今天,谷歌、Facebook、微软和Twitter四大互联网巨头联手宣布了一个“数据传输大计”,旨在号召不同平台间数据的无障碍传输。可移植性和互操作性是云技术创新和竞争的核心,如果真能得以实现,这无疑是一个伟大历程的开端!
1760 0
|
人工智能 vr&ar 芯片
动真格!Facebook挖角谷歌视觉芯片负责人,加入AI芯片大战
Facebook造芯片的计划又前进了一步。据彭博社报道,Facebook从谷歌聘请了芯片开发负责人,欲计划打造自己的定制芯片。
1434 0
|
Java 测试技术 PyTorch
Facebook开源PyTorch版本fairseq翻译模型,训练速度提高50%
FAIR的开源序列到序列(sequence-to-sequence)引擎现在可以在PyTorch使用了。FAIR今天发布了fairseq-py,这是一个用PyTorch实现的卷积seq2seq模型。fairseq-py是语言翻译以及其他 seq2seq 的NLP任务的一个很好的模型,新的工具包比以前的更高效率:生成翻译的速度比以前的提高了80%,训练速度提高了50%。
3379 0