剑桥AI公司:7天精通一门新语言,未来将学会7000种语言

简介: 剑桥AI公司Speechmatics使用机器学习技术Automatic Linguist,可在一天内学会一门语言的基础,一周内掌握一门新语言。该公司希望有朝一日能够掌握世界上的所有语言。

11月11日,剑桥AI公司Speechmatics正式上线其机器学习平台Automatic Linguist,能在一周内掌握一门新语言。该平台沿用剑桥大学研发的技术,能够识别并应用语言中的不同模式。目前,该平台能够识别28种语言,实现从语音到文字的准确转录。

2a49d62f223cf47727f7d94aae47bcabd6ab34d7

图示: Speechmatics将28种语言逐渐加入其系统中。


一个大公司客户要求Speechmatics两周内学会印地语,该公司发布了一个系统,根据测试,该系统比市场领先者的错误率少23%。

Speechmatics首席执行官Benedikt von Thüngen在接受Cambridge Independent采访时表示,“印地语非常简单。我们发现它在发音方面与英语非常相似,所以我们可以使用一个叫做‘适应’的过程。它从我们拥有的不同数据集中学习。”

“每种语言都有各自有趣的地方。韩语、土耳其语、芬兰语、德语等语言都是粘着构词,词语结合起来构成新的词汇。这是一个有待解决的有趣问题。”

“越南语、汉语等变调语言,也是一个很有意思的挑战。要教会系统去处理这些语言。”

fd93a9d49c6fb63e12bc6dec01c55cac2d0cf5ab

Speechmatics首席执行官Benedikt von Thüngen。


语言识别的传统路径要经过繁琐、昂贵的人工过程,专家要手动收集、清理海量数据。这是一个一次性系统,因此只关注使用最广泛的几种语言才算经济实用。

但是经过剑桥大学博士、Speechmatics首席技术官Tony Robinson数十年对神经网络的研究,Speechmatics可以通过识别基本声音和语法结构,在一天之内掌握一门语言的基础。

7d9ca2d8dc0e5841af3277791ad16c6cf9aa6e66

剑桥大学博士、Speechmatics首席技术官Tony Robinson。

 

该软件的主要用途之一是为电视提供准确、实时的字幕,并增加了专业个性化词典,如足球员姓名。

Benedikt说金融机构能够使用这一技术进行通话录音,以证明合规性和对PPI不当销售进行审查。他预言:“语音将成为与设备互动的主要机制。”

该公司白皮书提到,“我们的终极目标是为所有语言提供一个语言包。鉴于世界上约有7000种语言,这将是一个雄心勃勃的目标,我们希望有朝一日能够全部掌握这些语言。”


原文发布时间为:2017-11-16

本文作者:Cecilia

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:剑桥AI公司:7天精通一门新语言,未来将学会7000种语言

相关文章
|
机器学习/深度学习 人工智能 自然语言处理
当语言遇见智慧火花:GPT家族历代模型大起底,带你见证从平凡到卓越的AI进化奇迹!
【10月更文挑战第6天】随着自然语言处理技术的进步,GPT系列模型(Generative Pre-trained Transformers)成为该领域的明星。从GPT-1的开创性工作,到GPT-2在规模与性能上的突破,再到拥有1750亿参数的GPT-3及其无需微调即可执行多种NLP任务的能力,以及社区驱动的GPT-NeoX,这些模型不断进化。虽然它们展现出强大的语言理解和生成能力,但也存在如生成错误信息或偏见等问题。本文将对比分析各代GPT模型的特点,并通过示例代码展示其部分功能。
479 2
|
4月前
|
人工智能 Rust 并行计算
AI大模型开发语言排行
AI大模型开发涉及多种编程语言:Python为主流,用于算法研发;C++/CUDA优化性能;Go/Rust用于工程部署;Java适配企业系统;Julia等小众语言用于科研探索。
1664 127
|
10月前
|
人工智能 程序员 API
Motia:程序员福音!AI智能体三语言混编,零基础秒级部署
Motia 是一款专为软件工程师设计的 AI Agent 开发框架,支持多种编程语言,提供零基础设施部署、模块化设计和内置可观测性功能,帮助开发者快速构建和部署智能体。
1022 15
Motia:程序员福音!AI智能体三语言混编,零基础秒级部署
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
YuE 是香港科技大学和 M-A-P 联合开发的开源 AI 音乐生成模型,能够将歌词转化为完整的歌曲,支持多种音乐风格和多语言。
2066 23
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
|
9月前
|
存储 人工智能 JSON
AI智能体内战终结者!A2A:谷歌开源的首个标准智能体交互协议,让AI用同一种“语言”交流
A2A是谷歌推出的首个标准化智能体交互协议,通过统一通信规范实现不同框架AI智能体的安全协作,支持多模态交互和长时任务管理,已有50多家企业加入生态。
819 0
AI智能体内战终结者!A2A:谷歌开源的首个标准智能体交互协议,让AI用同一种“语言”交流
|
11月前
|
XML 机器学习/深度学习 人工智能
CLaMP 3:音乐搜索AI革命!多模态AI能听懂乐谱/MIDI/音频,用27国语言搜索全球音乐
CLaMP 3是由清华大学团队开发的多模态、多语言音乐信息检索框架,支持27种语言,能够进行跨模态音乐检索、零样本分类和音乐推荐等任务。
900 1
CLaMP 3:音乐搜索AI革命!多模态AI能听懂乐谱/MIDI/音频,用27国语言搜索全球音乐
|
9月前
|
人工智能 自然语言处理 搜索推荐
13.5K Star!支持5国语言+全栈语音生成,这个开源AI语音项目绝了!
CosyVoice是由FunAudioLLM团队开发的多语言大语音生成模型,支持中文、英语、日语、韩语和粤语等5种语言。该项目提供从推理、训练到部署的全栈能力,具备零样本语音克隆、跨语言合成、指令控制等前沿功能。其技术架构包括底层模型、多语言支持、框架支持及部方案等,性能优越,RTF<0.2,GPU内存<4GB,QPS>20。相比同类项目,CosyVoice在语言支持、特色功能和部署难度上表现出色,支持本地部署保障数据隐私,并大幅降低商业方案成本。适用于自媒体创作、在线教育、游戏开发、智能硬件和影视制作等多种场景。
933 0
|
人工智能 自然语言处理 开发工具
Languine:专为开发者设计的 AI 多语言翻译工具,快速生成100+种语言的准确翻译,简化应用程序的 i18n 国际化配置
Languine 是一款面向开发者的 AI 翻译工具,支持 100+ 种语言,自动化翻译流程,提升多语言应用开发效率。
558 15
Languine:专为开发者设计的 AI 多语言翻译工具,快速生成100+种语言的准确翻译,简化应用程序的 i18n 国际化配置
|
10月前
|
缓存 人工智能 自然语言处理
微软发明全新LLM语言,AI智能体交互效率翻倍!
微软发布DroidSpeak技术,优化大型语言模型(LLM)间的通信,显著提升AI智能体交互效率。该技术通过嵌入缓存和键值缓存重用,减少预填充延迟,降低高达50%的延迟,同时保持高质量生成。DroidSpeak适用于多种AI任务,提高协作效率,但在资源受限环境和处理模型差异性方面仍面临挑战。
441 3

热门文章

最新文章