剑桥AI公司：7天精通一门新语言，未来将学会7000种语言-阿里云开发者社区

剑桥AI公司：7天精通一门新语言，未来将学会7000种语言

2017-11-16 2086

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 剑桥AI公司Speechmatics使用机器学习技术Automatic Linguist，可在一天内学会一门语言的基础，一周内掌握一门新语言。该公司希望有朝一日能够掌握世界上的所有语言。

11月11日，剑桥AI公司Speechmatics正式上线其机器学习平台Automatic Linguist，能在一周内掌握一门新语言。该平台沿用剑桥大学研发的技术，能够识别并应用语言中的不同模式。目前，该平台能够识别28种语言，实现从语音到文字的准确转录。

2a49d62f223cf47727f7d94aae47bcabd6ab34d7

图示： Speechmatics将28种语言逐渐加入其系统中。

一个大公司客户要求Speechmatics两周内学会印地语，该公司发布了一个系统，根据测试，该系统比市场领先者的错误率少23%。

Speechmatics首席执行官Benedikt von Thüngen在接受Cambridge Independent采访时表示，“印地语非常简单。我们发现它在发音方面与英语非常相似，所以我们可以使用一个叫做‘适应’的过程。它从我们拥有的不同数据集中学习。”

“每种语言都有各自有趣的地方。韩语、土耳其语、芬兰语、德语等语言都是粘着构词，词语结合起来构成新的词汇。这是一个有待解决的有趣问题。”

“越南语、汉语等变调语言，也是一个很有意思的挑战。要教会系统去处理这些语言。”

fd93a9d49c6fb63e12bc6dec01c55cac2d0cf5ab

Speechmatics首席执行官Benedikt von Thüngen。

语言识别的传统路径要经过繁琐、昂贵的人工过程，专家要手动收集、清理海量数据。这是一个一次性系统，因此只关注使用最广泛的几种语言才算经济实用。

但是经过剑桥大学博士、Speechmatics首席技术官Tony Robinson数十年对神经网络的研究，Speechmatics可以通过识别基本声音和语法结构，在一天之内掌握一门语言的基础。

7d9ca2d8dc0e5841af3277791ad16c6cf9aa6e66

剑桥大学博士、Speechmatics首席技术官Tony Robinson。

该软件的主要用途之一是为电视提供准确、实时的字幕，并增加了专业个性化词典，如足球员姓名。

Benedikt说金融机构能够使用这一技术进行通话录音，以证明合规性和对PPI不当销售进行审查。他预言：“语音将成为与设备互动的主要机制。”

该公司白皮书提到，“我们的终极目标是为所有语言提供一个语言包。鉴于世界上约有7000种语言，这将是一个雄心勃勃的目标，我们希望有朝一日能够全部掌握这些语言。”

原文发布时间为：2017-11-16

本文作者：Cecilia

本文来自云栖社区合作伙伴新智元，了解相关信息可以关注“AI_era”微信公众号

原文链接:剑桥AI公司：7天精通一门新语言，未来将学会7000种语言

剑桥AI公司：7天精通一门新语言，未来将学会7000种语言

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

剑桥AI公司：7天精通一门新语言，未来将学会7000种语言

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景