前Facebook AI翻译主管加盟阿里达摩院,致力图片、视频、声音“秒翻”

本文涉及的产品
文本翻译,文本翻译 100万字符
文档翻译,文档翻译 1千页
语种识别,语种识别 100万字符
简介:

日前,前Facebook(脸书)应用机器学习部AI翻译团队主管黄非博士入职阿里巴巴达摩院。

入职后,他将在达摩院机器智能技术实验室,和同事推动AI翻译在新零售、跨境电商、视频等领域的实时翻译应用。

“语言”是跨境交易头号拦路虎。在阿里巴巴国际站,7成买家以英语沟通,还有30%为小语种。而卖家端的调研数据显示,大约96%的卖家对小语种无能为力。 阿里目前需要翻译的商品总量超过4亿。

5月18日,阿里巴巴在跨境电商中正式上线对话实时翻译功能,破解买卖家语言不通难题。据悉,这是全球首个电商领域的实时翻译AI(人工智能)产品。

目前,阿里AI实时翻译日均翻译次数达7.5亿,每年翻译次数超3000亿。公开资料显示,这是全球电商领域AI翻译之最。伴随电商全球化的步伐,阿里AI翻译发展壮大,其AI实时翻译工具目前提供21种热门语言,包括43个语言方向翻译服务,满足全球用户浏览不同国家商品的翻译需求。

8c9c2d889148f71cd23ae4fe564ca7c1e4abbc7c

实时翻译

因此,阿里AI实时翻译俨然成了阿里全球化战略的“技术生命线”。

黄非说,“选择从Facebook来到阿里,主要是因为这里有着丰富的应用场景,能给AI翻译学科带来更广阔的研发和想象空间。”

他介绍,主流商业AI翻译引擎都基于文本,进行海量比较、学习。这种单一维度的数据分析方法,面临模型的学习效率低下等瓶颈。而基于阿里丰富的应用场景,他和同事可以尝试建立包括图片、图像、声音等多模态数据维度的翻译架构,使得AI翻译的学习过程,更接近人的学习语言过程。

1dd9e1c259305185b64a29352e0429e431ae78f9

“人学习语言,不是简单背字典,而是掌握图像、声音等字词延伸内容后,理解字词使用的环境以及背后含义。而目前的AI翻译引擎,可以说是海量学习、比对网上的‘双语文本数据字典’,这样的学习效率其实并不高。而基于多模态的翻译架构,将综合学习字词语义以及相关的图像、语境等含义, 力求更接近人类学习语言,理解世界的方式。”黄非表示。

在黄非博士加入达摩院之前,陈博兴、刘晓钟两位博士也加入了达摩院机器智能实验室NLP团队。陈博兴博士曾在加拿大国家研究委员会从事机器翻译研究,刘晓钟博士曾在美国雅虎从事信息检索工作。

aabf9773b509efedbf13adbb5a02cc81ce32d8ab

阿里达摩院机器智能技术NLP团队负责人司罗介绍,NLP团队现有近百人分布在中国、美国、新加坡等实验室,30%以上人员有博士学历,团队还在招贤纳士。

日前,有消息称,阿里巴巴将于下半年正式推出语音实时翻译和直播视频自动生成双语字幕功能,届时,跨境商家可直接通过视频交流。各位科学家的陆续加入,无疑将加速这一进程。


原文发布时间为:2018-05-21

本文作者:孙茜茜

本文来自云栖社区合作伙伴“天下网商”,了解相关信息可以关注“天下网商”。

相关文章
|
10天前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
73 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
MMAudio 是一个基于多模态联合训练的高质量 AI 音频合成项目,能够根据视频内容或文本描述生成同步的音频。该项目适用于影视制作、游戏开发、虚拟现实等多种场景,提升用户体验。
52 7
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
|
17天前
|
机器学习/深度学习 存储 人工智能
EfficientTAM:Meta AI推出的视频对象分割和跟踪模型
EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,旨在解决SAM 2模型在移动设备上部署时的高计算复杂度问题。该模型采用非层次化Vision Transformer(ViT)作为图像编码器,并引入高效记忆模块,以降低计算复杂度,同时保持高质量的分割结果。EfficientTAM在多个视频分割基准测试中表现出与SAM 2相当的性能,具有更快的处理速度和更少的参数,特别适用于移动设备上的视频对象分割应用。
36 9
EfficientTAM:Meta AI推出的视频对象分割和跟踪模型
|
5天前
|
人工智能 小程序 API
【一步步开发AI运动小程序】十七、如何识别用户上传视频中的人体、运动、动作、姿态?
【云智AI运动识别小程序插件】提供人体、运动、姿态检测的AI能力,支持本地原生识别,无需后台服务,具有速度快、体验好、易集成等优点。本文介绍如何使用该插件实现用户上传视频的运动识别,包括视频解码抽帧和人体识别的实现方法。
存储 人工智能 自然语言处理
48 6
|
算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(一)
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言
273 1
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(一)
|
算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言(三)
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言(三)
268 1
|
机器学习/深度学习 算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言(一)
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言
151 1
|
算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(三)
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(三)
233 1
|
算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(二)
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(二)
218 1
下一篇
DataWorks