MIT研发团队开发出新系统,想要教会机器人真正理解人类说话

简介:

对于机器人来说,其实就要能连贯的理解人类所说的上下文。

随着人工智能的发展,机器人领域的产品也开始逐渐强调交互性能,但是现有的技术仍然无法做到十分流畅的人机交互,主要体现在机器人很可能无法理解人类说话的语言环境,进而无法将聊天内容连贯起来。不过,最近来自麻省理工学院(MIT)的CSAIL团队正在解决这个问题。

MIT研发团队开发出新系统,想要教会机器人真正理解人类说话

研究人员开发了一个ComText系统,该系统能够帮助机器人理解人类给出的上下文指令。直白来说,就是研究人员正在赋予机器人“情景记忆”的概念,让机器人能记得那些包含自己的位置、类型和主人的细节。比方说如果人类告诉机器人它面前的盒子里放着人类的零食,它就能够在人类发出“帮我拿点食物”这一指令时,将面前的盒子递给人类。

MIT研发团队开发出新系统,想要教会机器人真正理解人类说话

目前该团队在测试机器人时,拥有了ComText系统的机器人能够正确理解指令的概率达到90%,这一概率也证明了该系统是真正切实可行的。

不过,想要让机器人真正理解人类说话,还有很漫长的一段路要走,但是CSAIL团队也希望可以通过自己的努力解决这一难题。


原文发布时间: 2017-09-01 09:10
本文作者: JOKER
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
4天前
|
机器学习/深度学习 数据采集 监控
量化交易机器人开发风控模型对比分析与落地要点
本文系统对比规则止损、统计模型、机器学习及组合式风控方案,从成本、鲁棒性、可解释性等维度评估其在合约量化场景的适用性,结合落地实操建议,为不同阶段的交易系统提供选型参考。
|
4月前
|
机器人 API 数据安全/隐私保护
微博评论脚本, 新浪微博自动评论机器人,autojs工具开发
该机器人包含登录验证、内容识别、智能回复和频率控制功能,使用AutoJS的控件操作API实现自动化。
|
2月前
|
传感器 人工智能 机器人
具身智能9大开源工具全景解析:人形机器人开发必备指南
本文旨在对具身智能、人形机器人、协作机器人、AI机器人、端到端AI系统、AI Agent、AI Agentic、空间智能或世界模型等前沿领域中具有重要影响力的开源软件产品或工具进行深入分析,重点聚焦于支持这些先进AI能力实现的工具、平台和框架。
926 7
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
TsingtaoAI具身智能机器人开发套件及实训方案
该产品套件创新性地融合了先进大模型技术、深度相机与多轴协作机械臂技术,构建了一个功能强大、灵活易用的人机协作解决方案。其核心在于将智能决策、精准感知与高效执行完美结合,为高校实训领域的发展注入新动力。
503 10
|
8月前
|
人工智能 开发框架 机器人
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
AstrBot 是一个开源的多平台聊天机器人及开发框架,支持多种大语言模型和消息平台,具备多轮对话、语音转文字等功能。
4776 38
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
|
9月前
|
人工智能 自动驾驶 安全
Cosmos:英伟达生成式世界基础模型平台,加速自动驾驶与机器人开发
Cosmos 是英伟达推出的生成式世界基础模型平台,旨在加速物理人工智能系统的发展,特别是在自动驾驶和机器人领域。
780 15
Cosmos:英伟达生成式世界基础模型平台,加速自动驾驶与机器人开发
|
6月前
|
人工智能 自然语言处理 机器人
机器人研发与AI集成的加速策略:模块化生态创新革命
法思诺创新专注于机器人研发与AI集成的加速策略,推动模块化生态革命。通过软硬件分层协作,将机器人分为“躯体操作系统”和“场景思维芯片”,解决当前研发复杂、成本高昂的问题。文章分析机器人研发现状、模块化分工优势及场景芯片应用,并展望未来机器人产业的“智能机时刻”。法思诺提供创新咨询与培训服务,助力企业破解技术难题,实现软硬一体化智能创新。关注法思诺,探索真创新之路。
125 0
|
10月前
|
人工智能 安全 机器人
OpenAI重拾规则系统,用AI版机器人定律守护大模型安全
在人工智能领域,大语言模型(LLM)展现出强大的语言理解和生成能力,但也带来了安全性和可靠性挑战。OpenAI研究人员提出“规则基于奖励(RBR)”方法,通过明确规则引导LLM行为,确保其符合人类价值观和道德准则。实验显示,RBR方法在安全性与有用性之间取得了良好平衡,F1分数达97.1。然而,规则制定和维护复杂,且难以完全捕捉语言的多样性。论文:https://arxiv.org/pdf/2411.01111。
348 13
|
11月前
|
算法 机器人 语音技术
由通义千问驱动的人形机器人具身智能Multi-Agent系统
申昊科技人形机器人小昊,集成通义千问多模态大模型的具身智能系统,旨在讲解销售、迎宾表演等场景。机器人通过语音、动作等方式与用户互动,利用云端大语言模型处理自然语言,结合视觉、听觉等多模态感知技术,实现流畅的人机对话、目标追踪、展厅讲解等功能。
1128 4
由通义千问驱动的人形机器人具身智能Multi-Agent系统
|
10月前
|
编解码 网络协议 机器人
顶顶通电话机器人开发接口对接大语言模型之实时流TTS对接介绍
大语言模型通常流式返回文字,若一次性TTS会导致严重延迟。通过标点断句或流TTS可实现低延迟的文本到语音转换。本文介绍了电话机器人接口适配流TTS的原理及技术点,包括FreeSWITCH通过WebSocket流TTS放音,以及推流协议和旁路流对接的详细说明。
779 1

热门文章

最新文章