前Facebook AI翻译主管加盟阿里达摩院,致力图片、视频、声音“秒翻”

简介:

日前,前Facebook(脸书)应用机器学习部AI翻译团队主管黄非博士入职阿里巴巴达摩院。

入职后,他将在达摩院机器智能技术实验室,和同事推动AI翻译在新零售、跨境电商、视频等领域的实时翻译应用。

“语言”是跨境交易头号拦路虎。在阿里巴巴国际站,7成买家以英语沟通,还有30%为小语种。而卖家端的调研数据显示,大约96%的卖家对小语种无能为力。 阿里目前需要翻译的商品总量超过4亿。

5月18日,阿里巴巴在跨境电商中正式上线对话实时翻译功能,破解买卖家语言不通难题。据悉,这是全球首个电商领域的实时翻译AI(人工智能)产品。

目前,阿里AI实时翻译日均翻译次数达7.5亿,每年翻译次数超3000亿。公开资料显示,这是全球电商领域AI翻译之最。伴随电商全球化的步伐,阿里AI翻译发展壮大,其AI实时翻译工具目前提供21种热门语言,包括43个语言方向翻译服务,满足全球用户浏览不同国家商品的翻译需求。

8c9c2d889148f71cd23ae4fe564ca7c1e4abbc7c

实时翻译

因此,阿里AI实时翻译俨然成了阿里全球化战略的“技术生命线”。

黄非说,“选择从Facebook来到阿里,主要是因为这里有着丰富的应用场景,能给AI翻译学科带来更广阔的研发和想象空间。”

他介绍,主流商业AI翻译引擎都基于文本,进行海量比较、学习。这种单一维度的数据分析方法,面临模型的学习效率低下等瓶颈。而基于阿里丰富的应用场景,他和同事可以尝试建立包括图片、图像、声音等多模态数据维度的翻译架构,使得AI翻译的学习过程,更接近人的学习语言过程。

1dd9e1c259305185b64a29352e0429e431ae78f9

“人学习语言,不是简单背字典,而是掌握图像、声音等字词延伸内容后,理解字词使用的环境以及背后含义。而目前的AI翻译引擎,可以说是海量学习、比对网上的‘双语文本数据字典’,这样的学习效率其实并不高。而基于多模态的翻译架构,将综合学习字词语义以及相关的图像、语境等含义, 力求更接近人类学习语言,理解世界的方式。”黄非表示。

在黄非博士加入达摩院之前,陈博兴、刘晓钟两位博士也加入了达摩院机器智能实验室NLP团队。陈博兴博士曾在加拿大国家研究委员会从事机器翻译研究,刘晓钟博士曾在美国雅虎从事信息检索工作。

aabf9773b509efedbf13adbb5a02cc81ce32d8ab

阿里达摩院机器智能技术NLP团队负责人司罗介绍,NLP团队现有近百人分布在中国、美国、新加坡等实验室,30%以上人员有博士学历,团队还在招贤纳士。

日前,有消息称,阿里巴巴将于下半年正式推出语音实时翻译和直播视频自动生成双语字幕功能,届时,跨境商家可直接通过视频交流。各位科学家的陆续加入,无疑将加速这一进程。


原文发布时间为:2018-05-21

本文作者:孙茜茜

本文来自云栖社区合作伙伴“天下网商”,了解相关信息可以关注“天下网商”。

相关文章
|
6月前
|
人工智能 API 数据安全/隐私保护
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
1536 12
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
|
8月前
|
人工智能 自然语言处理 数据可视化
AI视频培训|格律诗AI 视频创作与自媒体传播——某诗词学会
近日,TsingtaoAI派驻专家团队为某诗词学会学员交付《格律诗AI 视频创作与自媒体传播》培训。本课程精准切中行业痛点——传统诗词创作与现代传播方式的断层。课程摒弃泛泛而谈,直击实操:首日聚焦"工具认知+创作逻辑",系统梳理即梦、可灵等国产AI工具在格律诗意象可视化中的差异化应用,如将"月光在指尖碎裂"转化为动态场景;次日深入"语音表达+自媒体运营",传授用魔音工坊生成情感化配音、坤行数字人打造诗人形象的秘技,更结合抖音、小红书平台特性,解析"前5秒高光片段设计"等流量密码。
696 3
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
1058 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
8月前
|
人工智能 自然语言处理 机器人
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
|
7月前
|
机器学习/深度学习 人工智能 编解码
AI Compass前沿速览:PixVerse V5、gpt-realtime、Grok Code Fast、HunyuanVideo、OmniHuman-1.5、字节WaverAI视频、MiniCPM 4.5等
AI Compass前沿速览:PixVerse V5、gpt-realtime、Grok Code Fast、HunyuanVideo、OmniHuman-1.5、字节WaverAI视频、MiniCPM 4.5等
AI Compass前沿速览:PixVerse V5、gpt-realtime、Grok Code Fast、HunyuanVideo、OmniHuman-1.5、字节WaverAI视频、MiniCPM 4.5等
|
7月前
|
人工智能 编解码 自然语言处理
重磅更新!ModelScope FlowBench 支持视频生成 + 图像编辑,AI创作全面升级!
很高兴地向大家宣布,ModelScope FlowBench 客户端迎来重大功能升级! 本次更新不仅正式支持了视频节点功能,还新增了图像编辑与IC-Light智能打光等实用功能,同时对多个图像处理节点进行了深度优化和扩展。现在,您只需在 FlowBench 中轻松串联节点,即可使用 Wan2.1/Wan2.2、Qwen-Image-Edit、FLUX Kontext、IC-Light等强大模型,轻松实现创意内容的生成与编辑。 无论你是内容创作者、视觉设计师,还是AI技术爱好者,这次更新都将为你打开全新的创作边界。
1016 14
|
8月前
|
存储 人工智能 自然语言处理
让你拥有一个AI大脑,这个32.1k Github项目是你不错的选择,支持PDF、Markdown、代码、视频成为你的知识内容
Quivr 是开源全栈 RAG 平台,助你打造“第二大脑”,支持多文档类型与多种 LLM,实现智能搜索与聊天。具备语义检索、本地部署、隐私保护等功能,适用于个人知识管理与企业知识库,界面简洁易用,是高效智能问答的理想选择。
407 0
|
算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言(三)
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言(三)
488 1
|
机器学习/深度学习 算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言(一)
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言
423 1
|
算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(三)
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(三)
463 1

热门文章

最新文章