阿里AI实现全球首个实时翻译直播,214种语言翻译支持今年双11

本文涉及的产品
文本翻译,文本翻译 100万字符
图片翻译,图片翻译 100张
语种识别,语种识别 100万字符
简介: 10月21日,阿里完成全球首个多语言实时翻译的电商直播,该直播展示了AI无惧嘈杂环境、口音不标准及口语化语言风格等问题,实时将中文直播内容精准翻译成英语、俄语、西班牙语等语言。阿里方面透露,该技术将大规模应用于2020双11。

10月21日,阿里完成全球首个多语言实时翻译的电商直播,该直播展示了AI无惧嘈杂环境、口音不标准及口语化语言风格等问题,实时将中文直播内容精准翻译成英语、俄语、西班牙语等语言。阿里方面透露,该技术将大规模应用于2020双11。

image.png

达摩院AI可实时翻译直播内容及评论区的小语种语言

“语言”问题是不同地域商家和买家之间难以跨越的大山。数据显示,速卖通上约96%的中小企业无小语种翻译能力,而通常一个直播间就覆盖了十多个语种,82%的中国商家因此而放弃跨境直播。

尽管AI能辅助文本翻译,但直播场景的翻译任务更加复杂,它需要先后进行语音识别和翻译两个过程,并要克服口音不标准、口语化表达、直播环境嘈杂、商品专业名词多、新品新词更迭快等问题。例如,“然后我们的话新品大家的评价也看了”是一句口语化的句子,正确的翻译应为“Then we have read everyone's comments on new products”,但传统的翻译引擎很容易错误地翻译成“Then we also looked at our comments on new products”(然后我们也看了我们对新品的评价)。

为解决机器听不清、听不懂的问题,阿里在业界通用方案的基础上自研了更智能的语音模型,可在嘈杂的环境中“听清”直播内容;同时,在AI翻译任务过程中创新性集成了视觉信息的识别结果,可将口语化句子改写成正式表达句子;此外,达摩院将多领域的知识融入翻译模型,能举一反三,无需重新训练便能快速学习不同场景里不断更迭的专业名词。

过去几年,阿里AI翻译技术历经多次迭代升级,目前可提供214种语言的高质量翻译,一天可翻译3000亿个词语。并创造多项世界纪录,曾获2018国际机器翻译大赛(WMT)翻译任务5项语向冠军,质量评估任务6项冠军,30多项相关研究成果被国际AI顶会收录。同时,该技术也逐步应用于阿里巴巴内部及外部企业客户,日均调用量超过13亿次。

达摩院机器翻译团队负责人骆卫华表示,“让机器听清、听懂是实现精准翻译的基础,达摩院希望通过创新的AI算法继续攻克电商、教育、医疗等专业领域的翻译难题,帮助人类跨越语言障碍。”

相关文章
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
当语言遇见智慧火花:GPT家族历代模型大起底,带你见证从平凡到卓越的AI进化奇迹!
【10月更文挑战第6天】随着自然语言处理技术的进步,GPT系列模型(Generative Pre-trained Transformers)成为该领域的明星。从GPT-1的开创性工作,到GPT-2在规模与性能上的突破,再到拥有1750亿参数的GPT-3及其无需微调即可执行多种NLP任务的能力,以及社区驱动的GPT-NeoX,这些模型不断进化。虽然它们展现出强大的语言理解和生成能力,但也存在如生成错误信息或偏见等问题。本文将对比分析各代GPT模型的特点,并通过示例代码展示其部分功能。
81 2
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法
DGLM(Diffusion Guided Language Modeling)是一种新型框架,结合了自回归模型的流畅性和扩散模型的灵活性,解决了现有引导生成方法的局限性。DGLM通过扩散网络生成语义提案,并使用轻量级提示生成器将嵌入转化为软提示,引导自回归解码器生成文本。该方法无需微调模型权重,易于控制新属性,并在多个基准数据集上表现出色。实验结果显示,DGLM在毒性缓解、情感控制和组合控制等方面优于现有方法,为可控文本生成提供了新的方向。
43 10
扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法
|
28天前
|
消息中间件 人工智能 Cloud Native
|
26天前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
|
28天前
|
人工智能 Ubuntu Linux
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
|
2月前
|
人工智能 测试技术
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【9月更文挑战第20天】Meta研究人员提出了一种名为Transfusion的创新方法,通过融合Transformer和Diffusion模型,实现了能同时处理文本和图像数据的多模态模型。此模型结合了语言模型的预测能力和Diffusion模型的生成能力,能够在单一架构中处理混合模态数据,有效学习文本与图像间的复杂关系,提升跨模态理解和生成效果。经过大规模预训练,Transfusion模型在多种基准测试中表现出色,尤其在图像压缩和模态特定编码方面具有优势。然而,其训练所需的大量计算资源和数据、以及潜在的伦理和隐私问题仍需关注。
67 7
|
3月前
|
人工智能 前端开发 Java
【实操】Spring Cloud Alibaba AI,阿里AI这不得玩一下(含前后端源码)
本文介绍了如何使用 **Spring Cloud Alibaba AI** 构建基于 Spring Boot 和 uni-app 的聊天机器人应用。主要内容包括:Spring Cloud Alibaba AI 的概念与功能,使用前的准备工作(如 JDK 17+、Spring Boot 3.0+ 及通义 API-KEY),详细实操步骤(涵盖前后端开发工具、组件选择、功能分析及关键代码示例)。最终展示了如何成功实现具备基本聊天功能的 AI 应用,帮助读者快速搭建智能聊天系统并探索更多高级功能。
1185 2
【实操】Spring Cloud Alibaba AI,阿里AI这不得玩一下(含前后端源码)
|
2月前
|
消息中间件 人工智能 运维
|
2月前
|
人工智能 前端开发 Java
Spring Cloud Alibaba AI,阿里AI这不得玩一下
🏀闪亮主角: 大家好,我是JavaDog程序狗。今天分享Spring Cloud Alibaba AI,基于Spring AI并提供阿里云通义大模型的Java AI应用。本狗用SpringBoot+uniapp+uview2对接Spring Cloud Alibaba AI,带你打造聊天小AI。 📘故事背景: 🎁获取源码: 关注公众号“JavaDog程序狗”,发送“alibaba-ai”即可获取源码。 🎯主要目标:
67 0
|
4天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
35 8