剑桥AI公司：7天精通一门新语言，未来将学会7000种语言-阿里云开发者社区

剑桥AI公司：7天精通一门新语言，未来将学会7000种语言

2017-11-16 2263

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 剑桥AI公司Speechmatics使用机器学习技术Automatic Linguist，可在一天内学会一门语言的基础，一周内掌握一门新语言。该公司希望有朝一日能够掌握世界上的所有语言。

11月11日，剑桥AI公司Speechmatics正式上线其机器学习平台Automatic Linguist，能在一周内掌握一门新语言。该平台沿用剑桥大学研发的技术，能够识别并应用语言中的不同模式。目前，该平台能够识别28种语言，实现从语音到文字的准确转录。

2a49d62f223cf47727f7d94aae47bcabd6ab34d7

图示： Speechmatics将28种语言逐渐加入其系统中。

一个大公司客户要求Speechmatics两周内学会印地语，该公司发布了一个系统，根据测试，该系统比市场领先者的错误率少23%。

Speechmatics首席执行官Benedikt von Thüngen在接受Cambridge Independent采访时表示，“印地语非常简单。我们发现它在发音方面与英语非常相似，所以我们可以使用一个叫做‘适应’的过程。它从我们拥有的不同数据集中学习。”

“每种语言都有各自有趣的地方。韩语、土耳其语、芬兰语、德语等语言都是粘着构词，词语结合起来构成新的词汇。这是一个有待解决的有趣问题。”

“越南语、汉语等变调语言，也是一个很有意思的挑战。要教会系统去处理这些语言。”

fd93a9d49c6fb63e12bc6dec01c55cac2d0cf5ab

Speechmatics首席执行官Benedikt von Thüngen。

语言识别的传统路径要经过繁琐、昂贵的人工过程，专家要手动收集、清理海量数据。这是一个一次性系统，因此只关注使用最广泛的几种语言才算经济实用。

但是经过剑桥大学博士、Speechmatics首席技术官Tony Robinson数十年对神经网络的研究，Speechmatics可以通过识别基本声音和语法结构，在一天之内掌握一门语言的基础。

7d9ca2d8dc0e5841af3277791ad16c6cf9aa6e66

剑桥大学博士、Speechmatics首席技术官Tony Robinson。

该软件的主要用途之一是为电视提供准确、实时的字幕，并增加了专业个性化词典，如足球员姓名。

Benedikt说金融机构能够使用这一技术进行通话录音，以证明合规性和对PPI不当销售进行审查。他预言：“语音将成为与设备互动的主要机制。”

该公司白皮书提到，“我们的终极目标是为所有语言提供一个语言包。鉴于世界上约有7000种语言，这将是一个雄心勃勃的目标，我们希望有朝一日能够全部掌握这些语言。”

原文发布时间为：2017-11-16

本文作者：Cecilia

本文来自云栖社区合作伙伴新智元，了解相关信息可以关注“AI_era”微信公众号

原文链接:剑桥AI公司：7天精通一门新语言，未来将学会7000种语言

剑桥AI公司：7天精通一门新语言，未来将学会7000种语言

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

剑桥AI公司：7天精通一门新语言，未来将学会7000种语言

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景