智能玩具机器人Cozmo的背后:Anki如何打造这一现象级项目?

简介:

近日,机器人公司Anki推出第二款机器人玩具Cozmo,随即当天,银行业巨头J·P 摩根以5250万美元带头对其进行了投资。

智能玩具机器人Cozmo的背后:Anki如何打造这一现象级项目?

点一下手机,Cozmo的“脸”亮了起来,然后慢慢睁开自己的双眼,再松散松散筋骨后缓缓地离开充电插座。当不小心冲到边缘的时候,它还会停下来瞪大自己蓝色的眼睛,并用小小的声音大喊救命,恐惧地挥舞着自己的单个U型的机器臂,同时迅速反向自己的履带进行后退。

哪怕不能亲自体验一下Cozmo,从字里行间我们应该也可想象出一个呆萌可爱的机器人

机器人公司Anki自成立以来,共推出两款机器人玩具,一个是人工智能赛车Drive,另一个就是本文的主角Cozmo。和Drive一样,Cozmo也是玩具,但不同的是,Anki希望能将Cozmo打造成硬件计算领域的下一个大事件。

Anki的过去:让Cozmo没有后顾之忧

要想一个项目在没有后顾之忧的情况下取得成功,是需要很多准备工作的,而其中最重要的两个,就是资金的提供以及人才的配备。

智能玩具机器人Cozmo的背后:Anki如何打造这一现象级项目?

为项目积极融资

Anki公司的CEO Sofman曾是卡内基梅隆大学(CMU)机器人学项目一位很受重视的博士生,在他以及两位同学Mark Palatucci和Hans Tappeiner的未来人生构想中,他们觉得应该用他们的研究做一些特别的事。

早在发布第一款人工智能赛车玩具“Drive”之前,Sofman就已经在思考Cozmo了。在2011年,Anki的团队就开始在为项目资金的提供来源而劳走奔波,其中的拉拢目标就包括了风险投资者Marc Andreessen。据Andreessen回忆,不同于其他机器人学博士,在双方的第一次接触中,Sofman并没有特意表现自己的学历和说一些较为浮夸的说辞,而是实事求是的展现了一个可工作的Drive版本,并描绘了Cozmo以及在未来预期中的商业价值。

以一个投资者的眼光来看,Sofman几人真正的说到了投资者的心坎里。目前,Andreessen领导了一轮巨额投资,拥有了Anki的董事会席位,并称Anki是“我所见过的最好的机器人创业公司”。

智能玩具机器人Cozmo的背后:Anki如何打造这一现象级项目?

持续招募技术人才

对于一项科研项目来说,资金的确是一个重要的组成部分,但要说核心之所在,那就只会是“技术”,也就是人才的储备。

目前为止,Anki已经从2010年公司成立时的三位CMU博士成长到了现在的拥有130多位员工的企业,而在这其中,技术人员绝对占了极大的比重,其中包括一位从事计算机视觉研究的卡耐基梅隆大学的博士Andrew Stein,一位曾为巴斯光年等动画角色赋予了生命的男人Carlos Baena。在Cozmo的研发过程中,这两位起到了无法比拟的关键作用。

Anki的现在:让Cozmo更聪明更有趣

目前看来,Cozmo又聪明又有趣,是一个成功的案例。但在成功的背后,Cozmo的研发过程中也曾跳出许多“拦路虎”,比如计算机视觉、性格的深层开发等。

智能玩具机器人Cozmo的背后:Anki如何打造这一现象级项目?

Cozmo感知到的环境

用深度学习提升计算机视觉

Drive被限于赛道,因而只需要测绘赛道,Cozmo不同,它是“自由之身”,因此Cozmo就需要不断地对周围环境进行测绘,并根据这些信息来进行导航。

在这个点上,Cozmo面临的问题和谷歌的自动驾驶汽车一样:计算机视觉。针对这一问题,伯克利一位博士研究者Chelsea Finn曾说:“对于家用机器人,最大的挑战是理解非结构化的环境,并依据环境的状态采取行动。”幸运的是,研究者想出了答案——深度学习(机器学习的一个分支)。

由于需要不断的对周围环境进行测绘,因而机器学习成为了Cozmo开发中的一个关键部分。关于这个方面,CMU一位机器人学研究者Michael Wagner曾说:“因为你真的不知道这个系统应该怎么做。它应该怎么更倾向于在崎岖的路面行驶还是在平坦的路面行驶?你不知道。所以你让机器学习来做这件事。”大量的测试,大量的训练,然后该系统才能够学会如何靠自己做出反应。

基于计算机视觉和深度学习,Cozmo在实际操作中通过它嘴巴里的单个摄像头观察世界,这个摄像头每秒拍摄 15 帧画面,然后将这些画面发送给手机,手机进行所有处理之后再将指令返回给机器人,所以和Cozmo一起玩的时候一定要将手机带在身边。关于这点还是比较麻烦的,有望改进。

智能玩具机器人Cozmo的背后:Anki如何打造这一现象级项目?

Cozmo的实时图谱

用“情绪引擎”模仿人类情绪

在Cozmo的设定上,Anki想要的是一个充满个性的机器人,希望它能够有自己的创造力。因而,为了赋予这些机器人发自内心的情绪和反应,Anki团队特别关注了心理学家Paul Ekman写过的并在电影《头脑特工队》中描绘过的“核心情绪(Core Emotions)”,另外又做了大量关于情感的研究,最后创造一个被称为“情绪引擎(emotional engine)”的东西,这是一个影响机器人模仿感受的一系列算法的集合。

几乎和人一样,Cozmo知道任何给定时间的许多潜在的情绪反应,这些情绪反应会相互竞争,从Cozmo的处理器内部传递到该机器人的表达方式上。比如Cozmo在桌子边缘呼救后退的行为,Sofman 解释:“他看见了一个边缘,这激发了他里面的一个反应。”根据 Cozmo 所有可用状态的一个实时图谱,Sofman指出Cozmo“有点不大勇敢,有点不大冷静,有点不大快乐。”而这些正是紧张情绪的一个非常复杂的模拟。

当然,这些情感的表达还需要一个大前提,那就是拥有这些感受。为此,Anki招募到了现在被称为“Cozmo 灵魂”的男人Carlos Baena。Baena在皮克斯公司工作了十年,为瓦力、巴斯光年等很多动画角色赋予了生命。

在花了几个月时间研究卡通角色的眼睛,了解它们可以用怎样的方式交流什么内容后,Baena及其团队为Cozmo创造了一种无厘头的语言和一种活泼的声音。除此之外,他们还为 Cozmo写了一首乐曲,当它在周围运动时,这首曲子会从你的手机上播放出来。

Anki的未来:让Cozmo每天有新鲜事可做

智能玩具机器人Cozmo的背后:Anki如何打造这一现象级项目?

Cozmo的迭代设计

对于Cozmo未来的开发计划,Anki称将持续更新它的软件和数据,将它设计成可编程的,可以每天都有新鲜事可做。此外,Sofman还表示,他们希望其它公司也能创造出类似 Cozmo 的机器人,甚至是知道Cozmo并且想与其交朋友的机器人。虽然理想很丰满,但估计很难实现,看来Cozmo只能自己玩自己,将寂寞悲伤进行到底了。

如果未来的某一天,Anki真的实现了对Cozmo的所有预想,那将是一个开创性的大事件,毕竟至今还没有出现过一个不依靠人类就能自己形成创造力的机器人,而这样一个机器人除了外形配置上和人类不同之外,已经与人类没有什么不同了,完全可以与之进行真正的互动式的交流。而且,由于体型的娇小,即使具有伤害性,估计对人类也不会造成多大的伤害。

此前,银行业巨头 J·P 摩根(J.P. Morgan)就将投资重点放在了区块链,大数据和机器人三块。这不,在Cozmo公布的同一天,J·P摩根就以5250万美元领投了一轮对Anki公司的投资;其后,风险资本公司Andreessen Horowitz和Index Ventures以及对冲基金Two Sigma也参与了这一轮投资。在拥有了1.825亿美元的雄厚资金背景下,希望Anki公司可以取得更大的突破。


原文发布时间: 2016-06-29 19:53
本文作者: 韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
3月前
|
数据采集 自动驾驶 机器人
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
267 1
|
7月前
|
弹性计算 自然语言处理 Ubuntu
从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人
本文描述在阿里云上从0开始构建一个LLM智能问答钉钉机器人。LLM直接调用了阿里云百炼平台提供的调用服务。
从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人
|
6月前
|
机器人
陌陌自动回复消息脚本,陌陌自动打招呼回复机器人插件,自动聊天智能版
这是一款为陌陌用户设计的自动回复软件,旨在解决用户无法及时回复消息的问题,提高成交率和有效粉丝数。软件通过自动化操作实现消息检测与回复功能
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
TsingtaoAI具身智能机器人开发套件及实训方案
该产品套件创新性地融合了先进大模型技术、深度相机与多轴协作机械臂技术,构建了一个功能强大、灵活易用的人机协作解决方案。其核心在于将智能决策、精准感知与高效执行完美结合,为高校实训领域的发展注入新动力。
824 10
|
8月前
|
人工智能 自然语言处理 安全
Deepseek 的 “灵魂”,宇树的 “躯体”,智能机器人还缺一个 “万万不能”
法思诺创新探讨智能机器人产业的发展,指出Deepseek的AI“灵魂”与宇树的机器人“躯体”虽技术先进,但缺乏关键的商业模式。文章分析了两者在硬件和软件领域的困境,并提出通过软硬一体化结合及明确商业模式,才能实现真正实用的智能机器人。未来,需聚焦高频刚需场景、优化付费体验、推动技术创新,让智能机器人走进千家万户。法思诺提供相关课程与咨询服务,助力行业突破。
216 0
|
9月前
|
人工智能 自然语言处理 机器人
9.9K star!大模型原生即时通信机器人平台,这个开源项目让AI对话更智能!
"😎高稳定、🧩支持插件、🦄多模态 - 大模型原生即时通信机器人平台"
329 0
|
11月前
|
人工智能 机器人 API
AppFlow:无代码部署Dify作为钉钉智能机器人
本文介绍如何通过计算巢AppFlow完成Dify的无代码部署,并将其配置到钉钉中作为智能机器人使用。首先,在钉钉开放平台创建应用,获取Client ID和Client Secret。接着,创建消息卡片模板并授予应用发送权限。然后,使用AppFlow模板创建连接流,配置Dify鉴权凭证及钉钉连接凭证,完成连接流的发布。最后,在钉钉应用中配置机器人,发布应用版本,实现与Dify应用的对话功能。
2329 7
AppFlow:无代码部署Dify作为钉钉智能机器人
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
1353 64
|
10月前
|
人工智能 自然语言处理 算法
基于DeepSeek的具身智能高校实训解决方案——从DeepSeek+机器人到通用具身智能
本实训方案围绕「多模态输入 -> 感知与理解 -> 行动执行 -> 反馈学习」的闭环过程展开。通过多模态数据的融合(包括听觉、视觉、触觉等),并结合DeepSeek模型和深度学习算法,方案实现了对自然语言指令的理解、物体识别和抓取、路径规划以及任务执行的完整流程。
1540 12
|
8月前
|
传感器 机器学习/深度学习 人工智能
自己都站不稳,怎么护理人?智能机器人的自主平衡问题,用TRIZ和DeepSeek有解吗?
法思诺创新探讨机器人自主平衡难题,结合TRIZ创新理论与DeepSeek大模型,为仿人机器人动态平衡提供解决方案。文章分析了机器人平衡差的原因,包括复杂环境、传感器限制、算法难度和机械设计挑战等,并提出通过TRIZ原理(如矛盾识别、理想解)与DeepSeek的AI能力(如数据学习、强化学习)协同优化平衡性能。展望未来,2024-2028年将实现从实验室验证到家用场景落地,推动消费级人形机器人发展。
368 0