评论:语音识别适合网络应用

简介:

微软的语音识别技术以及对扬声器独立的语音识别软件的出现,让我们开始关注语音识别技术的发展和应用。

IT行业有时候看起来就好像是城市中的公交车,可能很多年都没有变,但是突然出现了大量的改变。最近,Nuance公布了它最新版的语音识别软件Dragon Naturally Speaking 9,而微软也在经历过一次惨痛的失败后,在SpeechTEK大会上重新推出了他令人印象深刻的语音技术产品。

我曾经用过这两个语音识别软件的前一个版本,客观地说,如果使用高质量的麦克风,它们都有很好的表现。虽然我还没有用过Dragon 9,但是据用过的人说,它比以前的版本有了很大的进步。除了精确度有所提高外,它也是第一个具有独立扬声器模式的语音识别软件。如果这一功能真的有效,那么将为语音识别技术打开一个广阔的应用空间。

我一直认为对着电脑说话是应该被避免的,不过微软看上去好像并不认同,从他在Windows Vista中加入语音识别技术就可以看出。而且我认为当Windows Vista大面积发行后,微软将更加公开推动语音识别技术,但愿这不会导致像在公车上大声讲电话这种不文明行为的泛滥。

目前各界对于语音识别技术的研究热情令我有些惊讶,很多大型企业都有这方面的专业研究团队,各大院校的有关研究也很多。如果不是要对着电脑说话,如此大规模的研究又是为了什么?也许答案是网络应用。

欧洲电信标准协会(Etsi)有一个叫做Aurora的项目,即开发一套在移动网络上的分布式语音识别应用标准。该标准规定,部分语音识别引擎工作在移动终端设备上,并将语音传输给识别中心。我对这种应用的接受程度比前面所说的要大,毕竟对着手机说话要比对着笔记本说话容易被人接受。

Etsi表示,语音识别的其中一项应用是用户在路上对着电话讲述会议内容,然后将这些内容通过邮件发送给自己,以便在回到办公室或回到住所之后再对会议内容进行进一步编辑。这听上去挺不错的,用户不会再去考虑其它一些网络服务商所提供的类似收费服务了。

正如目前流行的SpinVox 服务所展示的,用户在收到语音信箱的留言后,不是听到录音,而是看到留言的文字内容。一个中央语音识别系统可以让企业网络也具有类似的功能,由于微软的Office Communications Server 2007 内置了语音识别技术,因此也许这会是企业的一个不错的选择。

比尔。盖茨说,语音识别技术将成为未来十年的一个主流技术,这一点我也认可,但是这种技术在网络应用中的规模也许比在独立PC应用上的规模更大。无论如何,企业现在也应该开始考虑一下,语音识别技术到底是不是会对自己的系统效率有提高作用。




原文出处:科技行者
转载请与作者联系,同时请务必标明文章原始出处和原文链接及本声明。
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
8天前
|
数据采集 存储 JSON
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理,以及存储爬取的数据。通过具体示例,帮助读者掌握Scrapy的核心功能和使用方法,提升数据采集效率。
47 6
|
2天前
|
监控 安全
公司上网监控:Mercury 在网络监控高级逻辑编程中的应用
在数字化办公环境中,公司对员工上网行为的监控至关重要。Mercury 作为一种强大的编程工具,展示了在公司上网监控领域的独特优势。本文介绍了使用 Mercury 实现网络连接监听、数据解析和日志记录的功能,帮助公司确保信息安全和工作效率。
69 51
|
8天前
|
数据采集 监控 数据可视化
Fortran 在单位网络监控软件数据处理中的应用
在数字化办公环境中,Fortran 语言凭借其高效性和强大的数值计算能力,在单位网络监控软件的数据处理中展现出独特优势。本文介绍了 Fortran 在数据采集、预处理和分析可视化三个阶段的应用,展示了其在保障网络安全稳定运行和有效管理方面的价值。
37 10
|
3天前
|
机器学习/深度学习 移动开发 自然语言处理
HTML5与神经网络技术的结合有哪些其他应用
HTML5与神经网络技术的结合有哪些其他应用
16 3
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
医疗行业的语音识别技术解析:AI多模态能力平台的应用与架构
AI多模态能力平台通过语音识别技术,实现实时转录医患对话,自动生成结构化数据,提高医疗效率。平台具备强大的环境降噪、语音分离及自然语言处理能力,支持与医院系统无缝集成,广泛应用于门诊记录、多学科会诊和急诊场景,显著提升工作效率和数据准确性。
|
9天前
|
数据采集 前端开发 中间件
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第26天】Python是一种强大的编程语言,在数据抓取和网络爬虫领域应用广泛。Scrapy作为高效灵活的爬虫框架,为开发者提供了强大的工具集。本文通过实战案例,详细解析Scrapy框架的应用与技巧,并附上示例代码。文章介绍了Scrapy的基本概念、创建项目、编写简单爬虫、高级特性和技巧等内容。
33 4
|
11天前
|
机器学习/深度学习 存储 运维
图神经网络在复杂系统中的应用
图神经网络(Graph Neural Networks, GNNs)是一类专门处理图结构数据的深度学习模型,近年来在复杂系统的研究和应用中展现了强大的潜力。复杂系统通常涉及多个相互关联的组件,其行为和特性难以通过传统方法进行建模和分析。
35 3
|
9天前
|
机器学习/深度学习 自然语言处理 搜索推荐
智能语音交互:技术原理与应用前景####
【10月更文挑战第25天】 一句话概括本文主旨,并引发读者兴趣。 智能语音交互技术,作为人工智能领域的重要分支,正以前所未有的速度融入我们的生活,从简单的语音助手到复杂的多轮对话系统,它不仅重塑了人机交互的方式,还为多个行业带来了革命性的变化。本文将深入浅出地探讨智能语音交互的技术原理、当前主流技术路线、面临的挑战及未来发展趋势,为读者揭开这一高科技领域的神秘面纱。 ####
|
2天前
|
机器学习/深度学习 人工智能 安全
人工智能与机器学习在网络安全中的应用
人工智能与机器学习在网络安全中的应用
9 0
|
4天前
|
机器学习/深度学习 人工智能 TensorFlow
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【10月更文挑战第32天】本文将介绍深度学习中的一个重要分支——卷积神经网络(CNN),以及其在图像识别领域的应用。我们将通过一个简单的代码示例,展示如何使用Python和TensorFlow库构建一个基本的CNN模型,并对其进行训练和测试。
下一篇
无影云桌面