语音技术正在改变计算行业

简介:


image

英国科幻小说家 Arthur C. Clarke 曾经说过,任何足够高级的技术都近乎魔术。迅速崛起的语音计算技术证明了他的观点。使用该技术如同下咒语一样:只需要对着空气说几句话,附近的设备就可以满足愿望。

亚马逊Echo是一台语音圆柱形计算机,我们可以将它放在桌面上,呼叫“Alexa”就可以唤醒,它可以播放音乐,讲笑话,回答旅行问题,控制智能家电;就在圣诞之前,4%的美国家庭已经拥有Echo。

在智能手机市场,语音助手迅速发展。每周苹果Siri处理200亿个命令,在美国来自Android手机的Google语音搜索已经占了20%的份额。用语音发邮件、写信息已经相当可靠。既然能够说,为什么还要输入文字呢?

这是一次巨大的转变。语音有能力改变计算产业,它可以用更自然的方式互动。Windows、图标、菜单、触摸屏,与复杂的键盘相比它们无疑都是非常直观的交互方式。

如果可以与计算机对话,就可以完全废弃“用户界面”。手机不再只是没有线的电话,汽车不再只是没有马的车厢,同样的,没有屏幕和键盘的计算机可以变得更实用,更强大,更流行。

语音不会完全取代其它输入输出方式,有时,输入比说话更加方便。但在我们使用技术的过程中,语音的地位会越来越高。要完全发挥语音技术的潜力,还有一些障碍需要突破。

Alexa,什么是深度学习?

计算机口述系统已经存在多年了,不过系统并不可靠,需要进行长时间训练才能理解某个人的声音。近年来,计算机不需要训练就可以识别任何人的语音,这些突破全都归功于“深度学习”,它是一种人工智能技术,利用深度学习技术,软件可以用无数案例学习,这些案例一般来自网络。

有了深度学习,在识别笔迹时计算机像人一样精准,计算机翻译系统正在快速进步,“文本-语音”系统不再那么生硬,发出的声音更加自然。总之,不论从哪方面来看,计算机处理自然语言的能力越来越强。

有了深度学习,机器识别语音的能力提高,说话的方式不再那么呆板,尽管如此,它仍然无法理解语言的意义。理解意义是最大的难题,如果语音计算想要流行起来,这一障碍必须克服。

计算机只有理解环境,才能围绕某一主题进行连贯的对话,现在的系统只能对简单的一次性命令做出回应。

大学、大企业和小企业的研究人员正在努力解决这一问题,它们开发可以完成精致对话、可以处理复杂任务的机器人,这些机器人可以检索信息,为抵押贷款提供建议,还可以安排旅行计划。

什么时候魔法才能替代拼写?

语音计算如何进化,消费者与监管机构也起到了重要的决定作用。虽然语音技术仍然处在原始阶段,但是它已经带来一些问题:当系统面向个人时非常实用,它可以获得大量数据,比如日历、邮件、其它敏感信息。于是乎,隐私与安全问题接踵而来。

许多语音设备一直在监听,随时准备激活,问题因此变得更复杂。联网麦克风装进了每一个房间和每一台智能手机,这种现状已经引起一些人担忧。并非所有语音都被送到了云端,当设备听到触发短语时(比如“Alexa”、 “OK,Google”、 “Hey Cortana”、 “Hey,Siri”)才会将用户的语音传输到服务器,然后开始处理问题。如果设备开始存储语音,我们根本不知道谁持有数据,存储了哪些数据,何时存储的。

警察曾经调查Arkansas(阿肯色州)凶杀案,案发经过可能被亚马逊Echo监听,警察要求亚马逊开放语音数据,方便查看。亚马逊拒绝了,它不知这样做是否合法。

2016年也曾出现过相似的事情,当时苹果拒绝帮助 FBI 破解枪杀案凶手的 iPhone。这两件事告诉我们:应该建立规则,让大家知道何时接入个人隐私数据、获得什么数据是合理的。

即使这些问题没有解决,消费者还是会接受语音计算技术。在许多环境中,语音方便得多,自然得多。当我们在做其它事时,语音最能发挥作用。因为各种原因,有时用户无法使用屏幕或者键盘,此时语音计算可以拓宽用途。

事实上,语音技术不只对计算造成影响,还影响了语言本身。对于大多人来说,要想说一门不懂的外语比登天还难,计算机模拟翻译工具可以解决问题。如果机器可以说话,小语种就可以存活下来。在人类与计算机互动的历史长河中,触摸屏是最近出现的一次变革,如果能向语音转移,变革的力度会更大。

本文转自d1net(转载)

目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
《解锁元宇宙虚拟角色自主行为:AI与深度强化学习的融合变革》
元宇宙作为新兴领域,融合了VR、AR等技术,其虚拟角色的智能行为至关重要。目前,虚拟角色行为较为简单,缺乏自主性。AI与深度强化学习的结合为虚拟角色带来了“智慧大脑”,通过自然语言处理和计算机视觉技术,使虚拟角色能理解用户意图并作出合理反应。深度强化学习则让虚拟角色在互动中不断优化决策策略,提升社交、游戏和工作场景中的用户体验。尽管面临样本效率低、可解释性差等挑战,AI与DRL的融合将推动虚拟角色更加智能和个性化,开启人类与虚拟世界交互的新篇章。
|
7月前
|
机器学习/深度学习 人工智能 搜索推荐
AI如何改变医疗行业
在这篇文章中,我们将深入探讨人工智能(AI)如何在不同方面革新医疗行业。从诊断疾病到制定个性化治疗方案,AI的应用正在为医生和患者提供前所未有的便利和准确性。通过具体案例分析,本文将展示AI技术如何助力现代医学,并讨论其潜在的伦理和实际挑战。
144 0
|
8月前
|
人工智能 搜索推荐
影视与游戏行业AI视频制作的第3步:为角色生成说话视频
继 影视与游戏行业AI视频制作实战:第一步,角色形象设计的一致性以及影视与游戏行业AI视频制作实战:第二步,为角色生成个性化语音 后,实现角色生动化的下一步动作就是能让图像动起来。
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC是什么?对艺术设计学、视觉传达设计、数字媒体艺术等专业的影响
AIGC,人工智能生成内容,融合AI与内容创作,使用GAN、CLIP等技术自动生成图像、文本等,影响艺术设计、视觉传达、数字媒体领域。它提升创作效率,增加多样性,促进创新,改变教育方式,并与Adobe国际认证结合,为设计师提供竞争优势,引领行业变革。
|
11月前
|
人工智能 开发框架 Java
智库观察丨让AI智能体释放大模型无限潜能
创新应用的潜力,在于从单体智能到群体智能的跨越,当具有固定交互模式的低智能单体达到一定数量以后,就会使群体涌现超越个体智能的现象。
智库观察丨让AI智能体释放大模型无限潜能
|
11月前
|
机器学习/深度学习 人工智能 搜索推荐
内容挖掘——AIGC实现从“伪智慧”到“真智能”的跃迁
【1月更文挑战第7天】内容挖掘——AIGC实现从“伪智慧”到“真智能”的跃迁
138 1
内容挖掘——AIGC实现从“伪智慧”到“真智能”的跃迁
|
人工智能 自然语言处理 算法
AIGC能否真的可以改变未来?
随着人工智能技术的不断发展,AIGC(Artificial Intelligence General Control)已经成为人们热议的话题。AIGC是一个理论框架,它旨在实现一种能够像人类一样思考和行动的人工智能。许多人对AIGC寄予厚望,认为它能够真正改变未来。AIGC是一种新兴的技术,它已经开始进入我们的日常生活,AIGC是通过使用大量数据和算法来分析、预测和决策,可以被应用到许多领域,包括医疗保健、教育、交通和金融等行业。但是,我认为这个问题并不是那么简单。
161 1
AIGC能否真的可以改变未来?
|
存储 人工智能 编解码
深度解读智能媒体服务的重组和进化
LiveVideoStackCon2023上海站,阿里云视频云专场系列演讲-3
174 0
|
传感器 Web App开发 运维
5620亿参数,最大多模态模型控制机器人,谷歌把具身智能玩出新高度
5620亿参数,最大多模态模型控制机器人,谷歌把具身智能玩出新高度
209 1
|
机器学习/深度学习 人工智能 自然语言处理
人工智能如何改变视频游戏产业:增强和合成媒体
人工智能如何改变视频游戏产业:增强和合成媒体
155 0
人工智能如何改变视频游戏产业:增强和合成媒体
下一篇
oss创建bucket