前Facebook AI翻译主管加盟阿里达摩院,致力图片、视频、声音“秒翻”

本文涉及的产品
语种识别,语种识别 100万字符
文档翻译,文档翻译 1千页
文本翻译,文本翻译 100万字符
简介:

日前,前Facebook(脸书)应用机器学习部AI翻译团队主管黄非博士入职阿里巴巴达摩院。

入职后,他将在达摩院机器智能技术实验室,和同事推动AI翻译在新零售、跨境电商、视频等领域的实时翻译应用。

“语言”是跨境交易头号拦路虎。在阿里巴巴国际站,7成买家以英语沟通,还有30%为小语种。而卖家端的调研数据显示,大约96%的卖家对小语种无能为力。 阿里目前需要翻译的商品总量超过4亿。

5月18日,阿里巴巴在跨境电商中正式上线对话实时翻译功能,破解买卖家语言不通难题。据悉,这是全球首个电商领域的实时翻译AI(人工智能)产品。

目前,阿里AI实时翻译日均翻译次数达7.5亿,每年翻译次数超3000亿。公开资料显示,这是全球电商领域AI翻译之最。伴随电商全球化的步伐,阿里AI翻译发展壮大,其AI实时翻译工具目前提供21种热门语言,包括43个语言方向翻译服务,满足全球用户浏览不同国家商品的翻译需求。

8c9c2d889148f71cd23ae4fe564ca7c1e4abbc7c

实时翻译

因此,阿里AI实时翻译俨然成了阿里全球化战略的“技术生命线”。

黄非说,“选择从Facebook来到阿里,主要是因为这里有着丰富的应用场景,能给AI翻译学科带来更广阔的研发和想象空间。”

他介绍,主流商业AI翻译引擎都基于文本,进行海量比较、学习。这种单一维度的数据分析方法,面临模型的学习效率低下等瓶颈。而基于阿里丰富的应用场景,他和同事可以尝试建立包括图片、图像、声音等多模态数据维度的翻译架构,使得AI翻译的学习过程,更接近人的学习语言过程。

1dd9e1c259305185b64a29352e0429e431ae78f9

“人学习语言,不是简单背字典,而是掌握图像、声音等字词延伸内容后,理解字词使用的环境以及背后含义。而目前的AI翻译引擎,可以说是海量学习、比对网上的‘双语文本数据字典’,这样的学习效率其实并不高。而基于多模态的翻译架构,将综合学习字词语义以及相关的图像、语境等含义, 力求更接近人类学习语言,理解世界的方式。”黄非表示。

在黄非博士加入达摩院之前,陈博兴、刘晓钟两位博士也加入了达摩院机器智能实验室NLP团队。陈博兴博士曾在加拿大国家研究委员会从事机器翻译研究,刘晓钟博士曾在美国雅虎从事信息检索工作。

aabf9773b509efedbf13adbb5a02cc81ce32d8ab

阿里达摩院机器智能技术NLP团队负责人司罗介绍,NLP团队现有近百人分布在中国、美国、新加坡等实验室,30%以上人员有博士学历,团队还在招贤纳士。

日前,有消息称,阿里巴巴将于下半年正式推出语音实时翻译和直播视频自动生成双语字幕功能,届时,跨境商家可直接通过视频交流。各位科学家的陆续加入,无疑将加速这一进程。


原文发布时间为:2018-05-21

本文作者:孙茜茜

本文来自云栖社区合作伙伴“天下网商”,了解相关信息可以关注“天下网商”。

相关文章
|
25天前
|
存储 人工智能 自然语言处理
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
OmniThink 是浙江大学与阿里通义实验室联合开发的机器写作框架,通过模拟人类迭代扩展和反思过程,生成高质量长篇文章,显著提升知识密度和内容深度。
157 12
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
|
28天前
|
人工智能 达摩院 计算机视觉
SHMT:体验 AI 虚拟化妆!阿里巴巴达摩院推出自监督化妆转移技术
SHMT 是阿里达摩院与武汉理工等机构联合研发的自监督化妆转移技术,支持高效妆容迁移与动态对齐,适用于图像处理、虚拟试妆等多个领域。
68 9
SHMT:体验 AI 虚拟化妆!阿里巴巴达摩院推出自监督化妆转移技术
|
1月前
|
人工智能 缓存 Ubuntu
AI+树莓派=阿里P8技术专家。模拟面试、学技术真的太香了 | 手把手教学
本课程由阿里P8技术专家分享,介绍如何使用树莓派和阿里云服务构建AI面试助手。通过模拟面试场景,讲解了Java中`==`与`equals`的区别,并演示了从硬件搭建、语音识别、AI Agent配置到代码实现的完整流程。项目利用树莓派作为核心,结合阿里云的实时语音识别、AI Agent和文字转语音服务,实现了一个能够回答面试问题的智能玩偶。课程展示了AI应用的简易构建过程,适合初学者学习和实践。
97 22
|
2月前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
614 10
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
|
1月前
|
人工智能 API 开发者
阿里CEO吴泳铭-2024互联网大会发言:AI的最大价值是推动生产力变革
11月21日,2024年世界互联网大会“互联网企业家论坛”在乌镇召开。阿里巴巴CEO吴泳铭表示,AI的最大价值在于推动各行各业的生产力变革,而非仅限于开发超级APP。他强调,发展AI需建设繁荣的技术、产品和市场生态。目前,30多万家企业已接入阿里“通义”大模型,应用于代码开发、药物研发等场景。阿里巴巴坚持开源路线,全球开发者基于“通义千问”开发的衍生模型已突破7.8万个。吴泳铭认为,AI的发展需要行业共同努力,建设繁荣生态以实现高质量持续发展。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
师资研修|AI赋能教师教学能力转型-德阳某教育主管部门
近日,德阳市教育主管部门,面向全市中职院校的骨干教师,开展AIGC赋能教育教学师资培训。TsingtaoAI参与负责本次师资研修的教学。本次师资研修通过系统化、专业化的培训,帮助教师深入掌握AI大模型及生成技术在教学中的应用。课程以实践为核心,以案例为载体,涵盖AI提示词优化、教案与题库生成、PPT高效设计及AI数字人应用等核心内容,全面提升教师的教学效率与创新能力。
107 5
|
3月前
|
人工智能 自然语言处理 Swift
探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!
阿里国际AI团队发布的新模型Marco-o1,不仅擅长解决具有标准答案的学科问题(如代码、数学等),更强调开放式问题的解决方案。该模型采用超长CoT数据微调、MCTS扩展解空间等技术,提升了模型在翻译任务及复杂问题解决上的表现。研究团队还开源了部分数据和模型,供社区使用和进一步研究。
探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!
|
机器学习/深度学习 算法 决策智能
【重磅开源】Facebook开源 Nevergrad:一种用于无梯度优化的开源工具
【重磅开源】Facebook开源 Nevergrad:一种用于无梯度优化的开源工具
234 0
|
缓存 数据可视化 测试技术
开源多年后,Facebook这个调试工具,再登Github热门榜
让许多工程师合作开发大型应用大多会面临一个挑战,通常没有一个人知道每个模块是如何工作的,这种技能会让开发新功能、调查Bug或优化性能变得困难,为了解决这个问题,Facebook创建并开源了Flipper,一个可扩展的跨平台的调试工具,用来调试 iOS 和 Android 应用。近日又双叒登上了Github热榜。
|
前端开发 JavaScript 测试技术
Facebook 开源可扩展文本编辑器 Lexical
Meta(原 Facebook)近日开源可扩展文本编辑器 Lexical,源代码托管在 GitHub 上采用 MIT 许可证。
568 0
Facebook 开源可扩展文本编辑器 Lexical

热门文章

最新文章