避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

简介:

特定场景进行特定培训,这是打造更连贯、更自然的人机语音交互的一个解决途径。

“iPhone的市场占有率是多少?”

—“目前80%。”

“那华为的呢?”

—“怎么都喜欢华为?”

以上是发生在镁客君与某一语音交互机器人之间的对话。

避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

你来我往之间,那些令人“头痛”的瞬间

在日常生活中,通过语音交互技术,我们能够与机器人进行交流,或者是让后者实时控制一些家居产品;在办公时间,借助于语音交互技术,我们也能够直接口头交代语音助理一些工作,从而提升工作效率……

可以说,随着背后语音识别和自然语言处理技术的逐步提升,人们对于“语音交互”这一人机交互方式正在变得渐渐适应。不过,在你来我往的语音对话之间,我们也不可避免的也遇到了一些有时令人“哭笑不得”的BUG。

2017国家服务机器人产业高峰论坛于近日落下帷幕,在圆桌环节的自由问答时间,有人提出一个问题,称当前的服务机器人在人机语音交互的过程中,常常会词不达意,或者是出现上下文不连贯的问题,导致最终的用户体验不佳。可以说,这是当前人机交互上最“头痛”的问题,也是导致人工智能被冠上“人工智障”称号的根本原因。

避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

避免“人工智障”,我们目前需要将机器人关在“笼子”里

谈及这种“人工智障”现象,其中主要涉及自然语言处理和深度神经网络的一个问题。

一般情况下,基于自然语言处理技术,人工智能系统即能够对人们的语句进行拆分和处理,从而做到“理解”这句话,继而对用户作出相应的回应。至于上下文连贯,这其中主要关乎深度神经网络的一个搭建,换一种说法,主要是“知识图谱”在起作用。仍以本文最开始的对话为例:

“iPhone的市场占有率是多少?”

—“目前80%。”

“那华为的呢?”

—“目前是xx%。”

在深度神经网络,或者是知识图谱的协助下,当我们提出第二个问题的时候,它会将华为与上一个问题的“市场占有率”进行关联,从而做到对这一问题更为完整、精准的理解。

事实上,为了达到更为完美、自然的人机交互体验,难道人工智能企业就没有搭建深度神经网络、构造知识图谱吗?当然不是,只不过在这基础之上,依据当前机器人的语音交互的整体情况,我们还需要附加一些场景条件。

这一块问题的解决还是需要根据不同的场景来做不同的定制,毕竟这也不是说一个模型、一个算法就能解决好所有的问题。武汉泰迪智慧科技有限公司创始人兼董事长李成华表示。

总结一下也就是说,要想解决当前这一上下文理解不连贯的问题,我们还需要依据特定的场景来对机器人进行特定的数据训练,从而打造一个特定机器人。举个例子,比如智能客服机器人,其所能提供服务的领域包括金融、教育、酒店等多个领域,每个领域都有着其所特有的问题或是对话场景,为了保证对话的连贯,我们就得利用这些特有数据进行培训,构建一个面向垂直领域的知识图谱,以避免问题交叉、逻辑混乱等情况的出现。

避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

面对无人驾驶的落地问题,我们都说低速行驶、封闭性场景是其当前能够快速实现落地的一个方向,简单粗暴的说,也就是将无人驾驶汽车关在一个相对“封闭”的场景里。而与此类似,要想机器人在语音交互上表现的没有那么“智障”,我们也需要将其关在一个限定的“笼子”里面来实施培训,不同的是,无人驾驶汽车的“笼子”是在真实的物理世界,而机器人则是在一个虚拟层面。


原文发布时间: 2017-09-21 09:32
本文作者: 韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
机器学习/深度学习 计算机视觉
《深度剖析:残差连接如何攻克深度卷积神经网络的梯度与退化难题》
残差连接通过引入“短路”连接,解决了深度卷积神经网络(CNN)中随层数增加而出现的梯度消失和退化问题。它使网络学习输入与输出之间的残差,而非直接映射,从而加速训练、提高性能,并允许网络学习更复杂的特征。这一设计显著提升了深度学习在图像识别等领域的应用效果。
678 13
|
前端开发 UED 开发者
React 滚动监听 Scroll Listener
本文介绍React中实现滚动监听的方法,涵盖基本概念、常见问题及解决方案。通过监听`window`对象的`scroll`事件,开发者可以在用户滚动时触发自定义逻辑。文章详细探讨了冗余调用、组件卸载时未清理事件监听器、滚动位置不一致等常见问题,并提供了防抖、节流、保存滚动位置等解决方案。同时,强调了跨浏览器兼容性和性能优化的重要性,帮助开发者在实际项目中更好地实现滚动监听功能。
309 17
|
安全 Android开发 数据安全/隐私保护
《鸿蒙Next原生应用的独特用户体验之旅》
鸿蒙Next在界面设计、操作逻辑、动效体验等方面与iOS类似,强调简洁一致性,悬浮效果提升空间感。其操作便捷,动效流畅,性能优化使流畅度提升30%,媲美iOS。智能交互方面,鸿蒙Next的小艺助手和跨设备互联功能表现出色,支持识屏对话等深度交互。安全隐私保护机制细致,应用体积小,节省流量和存储空间。相比安卓和iOS,鸿蒙Next在用户体验上展现出独特优势,为用户带来更优质、便捷和安全的使用感受。
890 9
|
存储 人工智能 vr&ar
【AI系统】CPU 基础
CPU,即中央处理器,是计算机的核心组件,负责执行指令和数据计算,协调计算机各部件运作。自1946年ENIAC问世以来,CPU经历了从弱小到强大的发展历程。本文将介绍CPU的基本概念、发展历史及内部结构,探讨世界首个CPU的诞生、冯·诺依曼架构的影响,以及现代CPU的组成与工作原理。从4004到酷睿i系列,Intel与AMD的竞争推动了CPU技术的飞速进步。CPU由算术逻辑单元、存储单元和控制单元三大部分组成,各司其职,共同完成指令的取指、解码、执行和写回过程。
992 3
|
人工智能 新制造 芯片
2024年中国AI大模型产业发展报告解读
2024年,中国AI大模型产业迎来蓬勃发展,成为科技和经济增长的新引擎。本文解读《2024年中国AI大模型产业发展报告》,探讨产业发展背景、现状、挑战与未来趋势。技术进步显著,应用广泛,但算力瓶颈、资源消耗和训练数据不足仍是主要挑战。未来,云侧与端侧模型分化、通用与专用模型并存、大模型开源和芯片技术升级将是主要发展方向。
|
运维 监控 Cloud Native
云原生之运维监控实践:使用 taosKeeper 与 TDinsight 实现对 时序数据库TDengine 服务的监测告警
在数字化转型的过程中,监控与告警功能的优化对保障系统的稳定运行至关重要。本篇文章是“2024,我想和 TDengine 谈谈”征文活动的三等奖作品之一,详细介绍了如何利用 TDengine、taosKeeper 和 TDinsight 实现对 TDengine 服务的状态监控与告警功能。作者通过容器化安装 TDengine 和 Grafana,演示了如何配置 Grafana 数据源、导入 TDinsight 仪表板、以及如何设置告警规则和通知策略。欢迎大家阅读。
431 0
|
存储 监控 安全
开发者的黄金时代:原生鸿蒙应用市场的全生命周期服务
2024年10月22日,华为发布了HarmonyOS NEXT,标志着鸿蒙生态进入商用发展阶段。原生鸿蒙应用市场全面焕新,不仅在UI设计、互动体验和隐私安全机制上进行了重塑,还为开发者和用户提供了从开发到分发的全生命周期服务。通过统一上架、多端分发、隐私合规保障等措施,原生鸿蒙应用市场助力开发者实现高效、安全的应用开发与分发,为全球数亿鸿蒙用户带来更流畅、更安全的使用体验。
|
JSON 人工智能 物联网
西游再现,一键部署 Flux 文生图大模型生成西游人物
从花果山的灵石出世,到取经路上的九九八十一难,再到大闹天宫的惊心动魄……这些耳熟能详的西游场景,如今都能通过 Flux 模型,以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的 flux.1-dev-fp8 大模型,搭配 Lora 模型,无需复杂的配置,一键部署,你就能成为这场视觉盛宴的创造者。
1046 18
|
缓存 前端开发 数据可视化
前端基础(七)_表单的基本组成与使用
本文详细介绍了HTML表单的基本组成和使用,包括`<form>`标签、`<input>`表单域、`<select>`下拉列表、`<textarea>`多行文本域等元素。文章解释了表单的提交方式(GET和POST)、表单域的各种类型(文本、密码、单选按钮、复选框等)、提交按钮和重置按钮的作用,以及如何通过`<label>`标签提高表单的可访问性。此外,还讨论了表单元素的属性,如`readonly`、`disabled`、`maxlength`等。
347 1
|
机器学习/深度学习 自然语言处理 监控
深度学习之动态对抗策略
基于深度学习的动态对抗策略是为了应对不断变化的对抗环境而提出的一类方法,这些策略能够动态地调整和优化模型的防御机制,以提高深度学习模型在各种对抗攻击下的鲁棒性和安全性。
358 1

热门文章

最新文章