深度!市场已经存在成熟产品,阿里为什么还要做机器翻译?

本文涉及的产品
图片翻译,图片翻译 100张
语种识别,语种识别 100万字符
文档翻译,文档翻译 1千页
简介: 阿里巴巴从2012年就开始自主研发阿里翻译。经过3年多的发展,机器翻译已经能够提供包括机器翻译、人工翻译以及人机结合的业界领先电商领域翻译解决方案。
阿里云机器翻译是阿里语言服务发布的在线翻译服务,致力于帮助用户跨越语言鸿沟。它依托海量的互联网数据资源和领先的自然语言处理技术优势,能更加方便快捷地获取信息和服务。


机器翻译开放平台

目前阿里机器翻译支持全球19种热门语言互译,中文、英语、俄语、葡萄牙语、西班牙语、法语、印尼语、阿拉伯语、德语、希伯来语、印地语、意大利语、日语、韩语、荷兰语、波兰语、泰语、土耳其语、越南语。

为什么要做阿里云机器翻译?

根据中国电子商务研究中心发布的《2015年(上)中国电子商务市场数据监测报告》显示,2015年上半年,中国电子商务交易额达到7.64万亿元,同比增长30.4%。其中,B2B交易额达5.8万亿元,同比增长28.8%。网络零售市场交易规模达1.61万亿元,同比增长48.7%。

在如此大规模的跨境贸易市场中,任何一次交易都离不开解决三个问题,即信息流、物流和资金流。在三者之中,信息流更是首当其冲需要解决的难题,如果不解决信息流的问题,就无法产生交易,物流和资金流就无从谈起。

既然是跨境贸易,则必然要涉及到不同国家不同地域之间的买卖家的沟通问题。以阿里巴巴国际站为例,当前在平台上进行交易的买卖家主要来自全球的xx个国家,说着xx种不同的语言。怎么能够让买卖家之间了解彼此想要表达的东西,就是跨境贸易领域的一大难题。

那么为什么不能使用目前市场上已经非常成熟的百度翻译和谷歌翻译来解决跨境贸易中的语言难题呢?据统计,目前阿里巴巴国际站共有大约4.3亿的商品量,而全球速卖通也有近1.5亿的商品量。如果使用谷歌翻译和百度翻译来对这些商品的信息进行翻译,不计算未来的增量商品,仅将目前的存量翻译完,也需要大约100亿美金的翻译费用,这基本与阿里巴巴集团2015财年的净营收持平。因此在如此大规模的商品量下,如果使用第三方的翻译,惊人的费用是大多数人都无法承受的。

机器翻译的发展历程


钉钉消息翻译

为了助力集团内的跨境电商的发展,让交易没有语言的障碍,阿里巴巴从2012年就开始自主研发阿里翻译。经过3年多的发展,机器翻译已经能够提供包括机器翻译、人工翻译以及人机结合的业界领先电商领域翻译解决方案。

值得一提的是,从2012年到2015年,阿里翻译经过了4个重要的发展节点:
  • 2012年,阿里翻译在开源翻译系统的基础上进行了二次开发,具备了阿里翻译的雏形,真正成为了拥有自主知识产权的翻译引擎;
  • 2013年,阿里翻译开始为集团内的跨境电商提供翻译服务,相继上线了13种语言的翻译引擎;
  • 2014年,阿里翻译对技术进行了全方位的升级,在电商领域的翻译质量上超越了百度和谷歌,并且开始推出人工翻译服务,上线了人工翻译平台v1.0;
  • 2015年,阿里翻译对基础设施进行了完善,继续将翻译质量保持在业界领先水平,并且将社会化的众包技术与翻译相结合,推出了低成本高质量高效率的众包翻译解决方案。

现在的阿里机器翻译


图片翻译

现在的阿里机器翻译提供三种服务能力:商品信息翻译、商品搜索翻译和通用领域翻译。

商品信息翻译:商品详情的翻译是阿里翻译最重要的应用场景之一,需求主要来自跨境电商平台,当进入非英语的多语言市场时,需要将海量的英文商品信息翻译成多语言,供当地买家来查看。商品信息的翻译主要涉及到两个部分,已有存量商品的翻译以及新增商品的翻译。对于存量的商品信息,阿里翻译能够在12小时内完成了对阿里巴巴国际站4.4亿商品信息的翻译;能够在9小时内完成对去全球速卖通3.3亿商品信息的翻译;能够在30小时内对淘宝10亿商品信息的翻译。对于增量的商品信息,阿里翻译能够支持阿里巴巴国际站每天6千万的新增商品信息翻译,全球速卖通每天7.5千万的新增商品信息翻译,淘宝网每天1. 5千万的新增商品信息翻译。

商品搜索翻译:商品搜索翻译是阿里翻译的另一个重要的应用场景。跨境电商往往涉及到十数种语言的商品信息,同时网站上也会有使用多种语言的买家进行浏览。在他们搜索相应的商品信息的时候,也就必然会用到十数种语言。而出于成本和可行性的角度考虑,不可能为所有语言都开发一套搜索引擎。因此所有的多语言站统一使用英文的搜索引擎。那么就需要首先将用户的query词翻译成英文,调用英文搜索引擎匹配商品信息,再将多对应的多语言商品信息从数据库中取出,展示给用户。因此就需要阿里翻译提供query词的翻译引擎,一方面能够在极端的时间内提供翻译结果,一方面能够具有足够的高并发能力。以全球速卖通为例,每天全球速卖通的买家累计会调用近2亿次阿里query翻译服务,平均的相应时间在150ms以下,能够同时处理约2500次调用请求。

通用领域翻译:除了商品信息和商品搜索的翻译外,阿里翻译还助力集团内其他部门的语言服务需求,比如为国家站无线ATM、钉钉提供的消息翻译功能,为集团的舆情监控平台提供的外文舆情的翻译服务,以及为阿里旅行提供的菜单翻译服务。

截止到2016年4月,阿里翻译已经累计为集团19个部门共计23个应用场景提供了语言服务。
其中,为阿里巴巴国际站、全球速卖通、阿里巴巴中国站、天猫国际、淘宝海外、淘宝全球购提供了包括商品搜索、商品标题、商品详情、商品评论在内的电商领域机器翻译服务;为蚂蚁金服、钉钉、阿里云、先知平台、阿里旅行提供了包括通用文本、消息翻译、开发套件、舆情内容在内的通用领域的机器翻译服务;为天猫国际、阿里云、yunos等18个部门提供了人工翻译服务。
目录
相关文章
|
人工智能 自然语言处理
阿里云产品体系分为6大分类——人工智能——分为10种模块——机器翻译
阿里云产品体系分为6大分类——人工智能——分为10种模块——机器翻译自制脑图
97 1
|
自然语言处理 开发工具
机器翻译产品的开通使用
机器翻译是由阿里巴巴打造的在线智能机器翻译服务,在跨境电商、医疗、金融等行业提供了多语言、多场景的解决方案,支持214种语言,并且支持文本、文档、图片、语音、视频5种模态的翻译。针对不同的使用人群,提供了在线平台、Http、SDK接口调用方式。 下面以详细的案例介绍下机器翻译产品的开通使用
485 0
机器翻译产品的开通使用
|
自然语言处理 Java 开发工具
阿里云机器翻译产品机器批量翻译服务 Python SDK 调用指南
阿里云机器翻译产品下的机器批量翻译服务,支持同时对多段文本进行翻译。本文介绍如何使用机器批量翻译提供的Python SDK,包括SDK的安装方法及SDK代码示例。
538 0
|
机器学习/深度学习 存储 人工智能
INTERFACE | 从技术到产品,搜狗为我们解读了神经机器翻译的现状
3 月 12 日,搜狗正式在线上平台发布了「旅行翻译宝」。这款随身翻译设备结合了搜狗神经网络机器翻译、语音识别、图像识别等多项技术,不仅支持语音、图像翻译等多种翻译模式,还提供中英日韩俄德等 18 种语言互译。
268 0
INTERFACE | 从技术到产品,搜狗为我们解读了神经机器翻译的现状
|
自然语言处理 Java 开发工具
阿里云机器翻译产品机器批量翻译服务 Java SDK 调用指南
阿里云机器翻译产品下的机器批量翻译服务,支持同时对多段文本进行翻译。本文介绍如何使用机器批量翻译提供的JavaSDK,包括SDK的安装方法及SDK代码示例。
361 0
|
算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(一)
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言
261 1
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(一)
|
算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言(三)
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言(三)
262 1
|
机器学习/深度学习 算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言(一)
算法竞赛入门【码蹄集新手村600题】(MT1200-1220)C语言
141 1
|
算法 C语言
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(三)
算法竞赛入门【码蹄集新手村600题】(MT1180-1200)C语言(三)
212 1
下一篇
无影云桌面