评论:语音识别适合网络应用

简介:

微软的语音识别技术以及对扬声器独立的语音识别软件的出现,让我们开始关注语音识别技术的发展和应用。

IT行业有时候看起来就好像是城市中的公交车,可能很多年都没有变,但是突然出现了大量的改变。最近,Nuance公布了它最新版的语音识别软件Dragon Naturally Speaking 9,而微软也在经历过一次惨痛的失败后,在SpeechTEK大会上重新推出了他令人印象深刻的语音技术产品。

我曾经用过这两个语音识别软件的前一个版本,客观地说,如果使用高质量的麦克风,它们都有很好的表现。虽然我还没有用过Dragon 9,但是据用过的人说,它比以前的版本有了很大的进步。除了精确度有所提高外,它也是第一个具有独立扬声器模式的语音识别软件。如果这一功能真的有效,那么将为语音识别技术打开一个广阔的应用空间。

我一直认为对着电脑说话是应该被避免的,不过微软看上去好像并不认同,从他在Windows Vista中加入语音识别技术就可以看出。而且我认为当Windows Vista大面积发行后,微软将更加公开推动语音识别技术,但愿这不会导致像在公车上大声讲电话这种不文明行为的泛滥。

目前各界对于语音识别技术的研究热情令我有些惊讶,很多大型企业都有这方面的专业研究团队,各大院校的有关研究也很多。如果不是要对着电脑说话,如此大规模的研究又是为了什么?也许答案是网络应用。

欧洲电信标准协会(Etsi)有一个叫做Aurora的项目,即开发一套在移动网络上的分布式语音识别应用标准。该标准规定,部分语音识别引擎工作在移动终端设备上,并将语音传输给识别中心。我对这种应用的接受程度比前面所说的要大,毕竟对着手机说话要比对着笔记本说话容易被人接受。

Etsi表示,语音识别的其中一项应用是用户在路上对着电话讲述会议内容,然后将这些内容通过邮件发送给自己,以便在回到办公室或回到住所之后再对会议内容进行进一步编辑。这听上去挺不错的,用户不会再去考虑其它一些网络服务商所提供的类似收费服务了。

正如目前流行的SpinVox 服务所展示的,用户在收到语音信箱的留言后,不是听到录音,而是看到留言的文字内容。一个中央语音识别系统可以让企业网络也具有类似的功能,由于微软的Office Communications Server 2007 内置了语音识别技术,因此也许这会是企业的一个不错的选择。

比尔。盖茨说,语音识别技术将成为未来十年的一个主流技术,这一点我也认可,但是这种技术在网络应用中的规模也许比在独立PC应用上的规模更大。无论如何,企业现在也应该开始考虑一下,语音识别技术到底是不是会对自己的系统效率有提高作用。




原文出处:科技行者
转载请与作者联系,同时请务必标明文章原始出处和原文链接及本声明。
相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
9天前
|
机器学习/深度学习 自然语言处理 Linux
hisper 在 Linux 中的应用,以及如何利用它来实现高效的自动语音识别
【6月更文挑战第7天】本文探讨了Whisper,一个基于Linux的先进自动语音识别(ASR)系统,它使用PyTorch构建,支持多语言识别。在Linux环境下,通过安装依赖、下载代码、配置环境变量及编译安装,可实现Whisper的部署。Whisper以其多语言支持、高准确性和实时性,适用于语音助手、翻译等场景。随着技术发展,Whisper有望在更多领域发挥作用。
34 5
|
3天前
|
缓存 Java Scala
Scala网络编程:代理设置与Curl库应用实例
Scala网络编程:代理设置与Curl库应用实例
|
3天前
|
机器学习/深度学习 数据采集 运维
智能之网:深度学习在网络安全防御中的应用
随着网络攻击手段的日益复杂化,传统的安全防御措施已难以应对新型威胁。深度学习技术因其在数据处理和模式识别方面的强大能力,被广泛应用于网络安全领域。本文将探讨深度学习如何革新网络安全防御机制,包括其工作原理、应用实例及面临的挑战与未来发展方向。
|
4天前
|
安全 物联网 网络安全
密码学在现代网络中的应用:守护数字世界的基石
【6月更文挑战第12天】密码学在现代网络中扮演关键角色,保障信息安全和数据机密性。其应用包括数据加密(对称与非对称算法)、数字签名(验证信息完整性和身份)、安全协议(如SSL/TLS、IPsec)及身份验证。未来,量子密码学、隐私保护技术和物联网安全将是密码学发展的重要方向,抵御新威胁,守护数字世界。
|
6天前
|
前端开发 JavaScript 安全
WebAssembly技术的出现为我们提供了一种全新的解决方案,开启了高性能网络应用的新时代
【6月更文挑战第10天】WebAssembly是高性能网络应用的新时代技术,它是一种虚拟机格式,允许C/C++等语言编译成二进制格式在Web浏览器中运行。具备高性能、高可移植性和良好安全性,适用于游戏开发、图形处理、计算机视觉等领域。随着技术进步,WebAssembly将支持更多语言,结合低代码平台简化开发,但需解决编译优化和安全性等问题。它正重塑Web应用的未来,开启高性能应用新时代。
16 0
|
6天前
|
机器学习/深度学习 算法 数据挖掘
图像处理到神经网络:线性代数的跨领域应用探索
图像处理到神经网络:线性代数的跨领域应用探索
|
10天前
|
机器学习/深度学习 人工智能 语音技术
探索深度学习在语音识别中的应用
【6月更文挑战第6天】本文探讨了深度学习在语音识别中的应用,包括声学模型(使用RNN和CNN自动学习深层特征)和语言模型(利用RNN和LSTM捕捉上下文信息)。深度学习的优势在于强大的特征学习、端到端学习和实时性。然而,数据稀疏性、多语种及口音识别、背景噪声等问题仍是挑战。未来,深度学习有望在语音识别领域实现更多突破。
|
13天前
|
数据采集 前端开发 JavaScript
Symfony Panther在网络数据采集中的应用
Symfony Panther在网络数据采集中的应用
Symfony Panther在网络数据采集中的应用
|
13天前
|
传感器 监控 算法
【计算巢】无线传感器网络(WSN)在智能城市中的应用
【6月更文挑战第3天】智能城市中的无线传感器网络(WSN)在交通监控、环境监测、能源管理和公共安全等领域发挥关键作用。通过模拟代码展示了传感器收集环境数据的过程。尽管面临部署成本、网络安全和数据处理挑战,但WSN为城市发展带来巨大潜力,随着技术进步,将在智能城市中创造更多便利与改善。
【计算巢】无线传感器网络(WSN)在智能城市中的应用
|
14天前
|
机器学习/深度学习 自动驾驶 TensorFlow
图像识别:卷积神经网络(CNN)的应用
【6月更文挑战第2天】卷积神经网络(CNN)是图像识别的得力工具,能识别物体、人脸等。广泛应用于安防、医疗和自动驾驶等领域。通过学习图像特征,CNN实现智能识别。示例代码展示了使用TensorFlow构建简单CNN识别MNIST手写数字。尽管实际应用更复杂,但CNN已显著改变生活,并将持续带来惊喜。
48 0

热门文章

最新文章