体验 Vista Speech Recognition,使梦想成为可能

简介:
还记得我们经常在电影里看到的一个场景么?某人在操作计算机时不单单只是使用键盘或鼠标与计算机进行对话,而是使用语音来直接控制操作计算机,这便是语音识别技术。这项技术其实很早就已经开始在使用,但是应用面却非常有限。早期我们只是通过语音识别来输入文字或进行简单的人机交互操作,随着多媒体应用技术的发展,硬件性能的提升,操作系统功能的日益完善,使得这个梦想成为了可能。今天,使用 Vista 操作系统的用户可以使用到这项更加完善的技术,并有效提高我们的效率,为我们使用操作系统带来前所未有的体验。
      要使用 Speech Recognition 这个功能,我们需要对音频子系统进行配置并激活这个程序,在激活之后,系统会自动运行语音识别指南来帮助我们认识如何使用语音识别技术与计算机进行交互式操作,在学习后我们便可以使用语音命令来进行操作了。为了提高语音识别的准确率我们可以使用 Speech Recognition 的学习功能进行计算机识别训练。
      下来就让梦想成为现实吧。
      首先,在任务栏下的系统栏区域找到并鼠标右击小喇叭图标(Volume Mixer),之后点击“Recording Devices”。
      之后,选中录音设备,并点击“Configure”进行配置。
      这时页面会跳转到“Speech Recognition Options”,在这里我们需要先对麦克风进行配置才能有效地进行语音识别,为此点击“Set up microphone”。此外在以后如果需要再次使用语音识别指南,或进行语音识训练都可以在这里激活他们。如果要起用语音识别功能请点击“Start Speech Recognition”。
      在 Microphone Setup Wizard 中选择我们当前的设备类型,笔记本用户如果内置麦克风可以选择“Desktop Microphone”,我在小黑上操作感觉非常好!
      当完成了麦克风的配置之后,我们便可以通过语音识别指南来了解在 Vista 上如何使用这项功能。强烈建议大家认真地去看完这个操作指南她会给你带来很大的帮助。

      现在我们就可以开始使用全新的交互操作方式,在桌面的顶部和任务栏下系统栏区域中我们可以看到语音识别控制台和图标,我们可以方便地进行切换和配置语音识别系统。

      通过语音识别选项中的语音识别学习,我们可以提高计算机对语音识别的准确率。
      此外“Speech Recognition Options”我们也可以通过“Control Panel”来打开它。
      星期六晚上,因为微软 WGA 服务出现故障,我刚装好的英文 Vista 旗舰版没能通过正版验证,所以也没有心情去搞 WDS 的文章,正好测试了语音识别功能!感觉非常有意思,我的英文发音看来系统还是能够识别的,哈哈!不过也够让我尴尬的,毕竟词汇量不大,很多发音不正规而且很生硬,让一旁正在上网的太太狠狠地耻笑了我一番!无所谓啦,一定要有阿Q精神,否则英语怎么能长进,正好为明年参加美国的MVP全球峰会做准备了。好好学习,天天向上!
      如果您使用的是中文版的 Vista ,同样可以体验一下,而且可以用中文哦!我在猜测一些不会使用键盘和鼠标的人估计也能很容易上手了。



本文转自 苏繁 51CTO博客,原文链接:http://blog.51cto.com/goxia/220096,如需转载请自行联系原作者
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
搜索推荐 Android开发 iOS开发
AppsFlyer 研究(四)OneLink Deep Linking Guide
AppsFlyer 研究(四)OneLink Deep Linking Guide
508 0
|
设计模式 前端开发 C#
Helix Toolkit:为.NET开发者带来的3D视觉盛宴
Helix Toolkit:为.NET开发者带来的3D视觉盛宴
298 0
|
人工智能 自然语言处理 JavaScript
UCAI(Unified Cognitive AI)
UCAI(Unified Cognitive AI)是一个人工智能服务平台,由阿里云提供,旨在为开发者提供智能化应用开发的一站式服务。
687 2
|
人工智能 自然语言处理 Kubernetes
【Microsoft】与 Bing AI 进行 ⌈狂飙⌋
【Microsoft】与 Bing AI 进行 ⌈狂飙⌋
299 0
|
机器学习/深度学习 编解码 人工智能
7 Papers & Radios | MIT深度学习框架登Nature封面;2010年以来,ML算力需求增100亿倍(1)
7 Papers & Radios | MIT深度学习框架登Nature封面;2010年以来,ML算力需求增100亿倍
124 0
|
机器学习/深度学习 编解码 人工智能
7 Papers & Radios | MIT深度学习框架登Nature封面;2010年以来,ML算力需求增100亿倍(2)
7 Papers & Radios | MIT深度学习框架登Nature封面;2010年以来,ML算力需求增100亿倍
|
存储 编译器 计算机视觉
Opencv项目实战Vision-Life(1) 虚拟键盘
前段时间一直在查官方文档学CV,感觉进度较慢,而且内心空虚感觉什么都没学到,于是产生了边做边学的想法,正好也能借此发发朋友圈装个逼(事后证明效果还是不错滴)
190 0
|
存储 编解码 文字识别
Opencv项目实战Vision-Life(3) 车牌识别
由于不同图像的分辨率不同,所以我们要统一大小。同时要保证,我们感兴趣的区域(ROI,这里是车牌),必须保留在框架中
200 0
|
机器学习/深度学习 编解码 固态存储
【论文泛读】轻量化之MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications(下)
【论文泛读】轻量化之MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications(下)
【论文泛读】轻量化之MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications(下)
|
机器学习/深度学习 存储 编解码
【论文泛读】轻量化之MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications(上)
【论文泛读】轻量化之MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
【论文泛读】轻量化之MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications(上)