IBM将公开语音识别源码 携Avaya拓语音市场

简介:

IBM将于周一宣布向两个源码开放软件组织公开其部分语音识别软件。

此举标明IBM意欲促进语音应用软件开发,是和微软等竞争对手较量中的出奇制胜之招。预计在今后几年内随着客户呼叫中心、汽车电子等的发展,该市场将呈上升趋势。为此,IBM再次亮出其杀手锏:公布部分专署软件源码,以便开发人员改进。

IBM负责软件业务的高级副总Steven A. Mills说:“我们努力推动源码标准,从而开发出越来越多的语音应用软件。我们的源码公开举措是为促使该产业生态形成而迈出的重要一步。这样将会为IBM带来更多的商业机会”

经过数十年的研发,语音识别已经开始逐步进入主流应用。统计建模、模式匹配算法等领域的进展以及处理能力的提高都使得语音识别范围较以前有了长足的提高。

以前语音识别应用软件都是客户化定制的,而如今变成了可重用的标准软件包。现在可以在Web应用程序中加入语音功能,这样程序开发人员就可以使用他们熟悉的工具而无需额外培训。

Opus研究机构分析师Mark Plakias说:“整个语音领域的发展趋势和信息技术业方向一致,语音软件成本应该大幅降低”。

IBM即将公开的语音识别源码是该公司花了大约1000万美元才开发而成的。一系列处理基本日期、时间、地名等的语音软件将交付给Apache软件组织。该公司还打算将其语音编辑工具捐赠给另一家源码开放机构Eclipse组织。

以前IBM就曾向源码开放团体公布过其代码。譬如,在8月份该公司曾向Apache公开了其用Java编写的数据库软件Cloudscape。而且IBM一直对诸如Apache Web服务器及Linux操作系统等源码开放项目鼎立支持。Mills 说:“这是我们一贯做法”。

IBM还将公布同呼叫中心供应商Avaya达成的一项合作协议,双方共同为企业客户开发基于语音的自助应用程序。Avaya通讯应用部副总Eileen Rudden说:“Web自助及语音服务可以同时开发。我们认为这是降低构建语音应用成本的一条有效途径,并且可以进一步拓展市场”。

根据该协议,Avaya计划为IBM的WebSphere提供其呼叫中心软件。然而这并非一个排它性协议。WebSphere是IBM软件战略的核心,它包括构建应用程序所需工具,并且其它软件可以在其平台上运行。

WebSphere是在操作系统之上的一层软件,对微软的Windows及.Net技术构成巨大威胁。

然而,微软也已经开发出了自己的语音识别标准工具,并于3月份发布了具有语音功能的Speech Server 2004。超过10万软件开发人员下载了微软基于.Net技术的免费语音开发工具。

据微软高层宣称,采用该公司技术构建语音应用程序比诸如IBM等其它公司的工具更加便宜和快速。

微软语音技术市场主管James Mastan说:“IBM在步微软后尘,IBM未能像微软一样将公司技术推向更加广阔的市场”。




原文出处:科技行者
转载请与作者联系,同时请务必标明文章原始出处和原文链接及本声明。
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
Java 语音技术 开发工具
Android 讯飞离线语音听写/离线语音识别SDK
Android 讯飞离线语音听写/离线语音识别SDK
527 0
Android 讯飞离线语音听写/离线语音识别SDK
|
2月前
|
Ubuntu 机器人 语音技术
语音识别与语音控制的原理介绍
硬件平台 机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版 运行案例 首先进入OriginBot主控系统,运行一下指令。请注意,部分操作OriginBot内暂未放入,请根据内容进行适当处理。 cd /userdata/dev_ws/ # 配置TogetheROS环境 source /opt/tros/setup.bash # 从tros.b的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ . # 加载音频驱动,设备启动之后只
219 83
|
1月前
|
Ubuntu 机器人 语音技术
语音识别与语音控制
【10月更文挑战第4天】硬件平台 机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版 运行案例 首先进入OriginBot主控系统,运行一下指令。请注意,部分操作OriginBot内暂未放入,请根据内容进行适当处理。 cd /userdata/dev_ws/ # 配置TogetheROS环境 source /opt/tros/setup.bash # 从tros.b的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ . # 加载
|
1月前
|
人工智能 语音技术 数据格式
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
31 0
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
|
3月前
|
存储 算法 Serverless
【matlab】matlab基于DTW和HMM方法数字语音识别系统(源码+音频文件+GUI界面)【独一无二】
【matlab】matlab基于DTW和HMM方法数字语音识别系统(源码+音频文件+GUI界面)【独一无二】
|
4月前
|
达摩院 语音技术 异构计算
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
|
4月前
|
机器学习/深度学习 人工智能 API
在人工智能和机器学习的领域中,语音识别(Speech Recognition,SR)是一个重要的研究方向。它旨在将人类的语音转换为计算机可读的文本。
在人工智能和机器学习的领域中,语音识别(Speech Recognition,SR)是一个重要的研究方向。它旨在将人类的语音转换为计算机可读的文本。
|
5月前
|
机器学习/深度学习 搜索推荐 安全
语音识别技术是一种将语音信号转换为文本或命令的技术,
语音识别技术是一种将语音信号转换为文本或命令的技术,
|
6月前
|
JSON 自然语言处理 Java
Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战(超详细 附源码)
Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战(超详细 附源码)
308 0
|
6月前
|
机器学习/深度学习 自然语言处理 算法
什么是语音识别的语音助手?
【4月更文挑战第8天】
242 3
什么是语音识别的语音助手?