阿里AI实现全球首个实时翻译直播,214种语言翻译支持今年双11

本文涉及的产品
语种识别,语种识别 100万字符
图片翻译,图片翻译 100张
文本翻译,文本翻译 100万字符
简介: 10月21日,阿里完成全球首个多语言实时翻译的电商直播,该直播展示了AI无惧嘈杂环境、口音不标准及口语化语言风格等问题,实时将中文直播内容精准翻译成英语、俄语、西班牙语等语言。阿里方面透露,该技术将大规模应用于2020双11。

10月21日,阿里完成全球首个多语言实时翻译的电商直播,该直播展示了AI无惧嘈杂环境、口音不标准及口语化语言风格等问题,实时将中文直播内容精准翻译成英语、俄语、西班牙语等语言。阿里方面透露,该技术将大规模应用于2020双11。

image.png

达摩院AI可实时翻译直播内容及评论区的小语种语言

“语言”问题是不同地域商家和买家之间难以跨越的大山。数据显示,速卖通上约96%的中小企业无小语种翻译能力,而通常一个直播间就覆盖了十多个语种,82%的中国商家因此而放弃跨境直播。

尽管AI能辅助文本翻译,但直播场景的翻译任务更加复杂,它需要先后进行语音识别和翻译两个过程,并要克服口音不标准、口语化表达、直播环境嘈杂、商品专业名词多、新品新词更迭快等问题。例如,“然后我们的话新品大家的评价也看了”是一句口语化的句子,正确的翻译应为“Then we have read everyone's comments on new products”,但传统的翻译引擎很容易错误地翻译成“Then we also looked at our comments on new products”(然后我们也看了我们对新品的评价)。

为解决机器听不清、听不懂的问题,阿里在业界通用方案的基础上自研了更智能的语音模型,可在嘈杂的环境中“听清”直播内容;同时,在AI翻译任务过程中创新性集成了视觉信息的识别结果,可将口语化句子改写成正式表达句子;此外,达摩院将多领域的知识融入翻译模型,能举一反三,无需重新训练便能快速学习不同场景里不断更迭的专业名词。

过去几年,阿里AI翻译技术历经多次迭代升级,目前可提供214种语言的高质量翻译,一天可翻译3000亿个词语。并创造多项世界纪录,曾获2018国际机器翻译大赛(WMT)翻译任务5项语向冠军,质量评估任务6项冠军,30多项相关研究成果被国际AI顶会收录。同时,该技术也逐步应用于阿里巴巴内部及外部企业客户,日均调用量超过13亿次。

达摩院机器翻译团队负责人骆卫华表示,“让机器听清、听懂是实现精准翻译的基础,达摩院希望通过创新的AI算法继续攻克电商、教育、医疗等专业领域的翻译难题,帮助人类跨越语言障碍。”

相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
当语言遇见智慧火花:GPT家族历代模型大起底,带你见证从平凡到卓越的AI进化奇迹!
【10月更文挑战第6天】随着自然语言处理技术的进步,GPT系列模型(Generative Pre-trained Transformers)成为该领域的明星。从GPT-1的开创性工作,到GPT-2在规模与性能上的突破,再到拥有1750亿参数的GPT-3及其无需微调即可执行多种NLP任务的能力,以及社区驱动的GPT-NeoX,这些模型不断进化。虽然它们展现出强大的语言理解和生成能力,但也存在如生成错误信息或偏见等问题。本文将对比分析各代GPT模型的特点,并通过示例代码展示其部分功能。
156 2
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式的音频处理解决方案,极大地提高工作效率和音频处理的便捷性。
97 10
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
|
29天前
|
人工智能 Ubuntu 语音技术
ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言
ebook2audiobookXTTS 是一款开源的 AI 工具,能够将电子书转换为有声书,支持多种电子书格式和 16 种语言。该工具利用 Coqui XTTS 技术实现高质量的文本到语音转换,并提供命令行、Web 界面和 Docker 容器等多种使用方式。
65 3
ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言
|
26天前
|
人工智能 JSON 自然语言处理
智能化AI工具-语言翻译与本地化
在全球化发展的背景下,语言翻译与本地化需求日益增长。无论是跨境电商、国际合作,还是本地化应用开发,都需要高效、准确的翻译解决方案。阿里云通义千问作为一款强大的大语言模型,不仅具备出色的自然语言理解能力,还能够在多语言翻译和本地化场景中发挥重要作用。本博客将详细介绍如何基于阿里云通义千问开发语言翻译与本地化工具,包括产品介绍、程序代码以及阿里云相关产品的具体使用流程。
64 10
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
自然语言处理(NLP)是AI的重要分支,旨在让计算机理解人类语言
自然语言处理(NLP)是AI的重要分支,旨在让计算机理解人类语言。本文探讨了深度学习在NLP中的应用,包括其基本任务、优势、常见模型及具体案例,如文本分类、情感分析等,并讨论了Python的相关工具和库,以及面临的挑战和未来趋势。
72 1
|
2月前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
|
2月前
|
人工智能 Ubuntu Linux
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
72 10
|
4天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
转载:【AI系统】AI的领域、场景与行业应用
本文概述了AI的历史、现状及发展趋势,探讨了AI在计算机视觉、自然语言处理、语音识别等领域的应用,以及在金融、医疗、教育、互联网等行业中的实践案例。随着技术进步,AI模型正从单一走向多样化,从小规模到大规模分布式训练,企业级AI系统设计面临更多挑战,同时也带来了新的研究与工程实践机遇。文中强调了AI基础设施的重要性,并鼓励读者深入了解AI系统的设计原则与研究方法,共同推动AI技术的发展。
转载:【AI系统】AI的领域、场景与行业应用