【V直播】三专家解读波士顿动力Atlas惊艳后空翻7大技术难点

简介: 上周五,波士顿动力发布机器人Atlas的最新视频。这个会后空翻的机器人在网络上引起热议,新智元微信公众号上的文章阅读量也超过了10万+。昨天,在新智元V享圈,我们请到三位资深的机器人研究者,一起探讨这一神奇的Atlas背后的技术原理。本文带来精彩实录。

3142762c28ec8780c7f1d149387b9c0cc99fd151

会后空翻的波士顿动力Atals机器人

三位嘉宾分别是:

段晋军,东南大学博士生,2015年9月-2016年9月在新加坡南洋理工大学访学。研究方向是多机器人协作、基于阻抗模型的灵巧双臂位置力协调控制、增强学习等。

孙广彬,东北大学工学博士,研究方向为多臂、多足机器人智能运动规划、控制及人机协作。2010年9月至2012年9月在卡耐基梅隆大学交流访问,2015年11月至2017年2月在新加坡南洋理工大学从事博士后研究。

梁聪慧,目前是新加坡科技研究局先进制造与技术中心的高级科学家,是一名经验丰富的机器人技术工程师,同时也是一名成功的高科技连续创业者。他拥有10多年在机械、机电自动化和机器人技术领域的工作经验,曾在重型机械制造业、南洋理工大学机器人研究中心和 A*STAR先进制造技术中心拥有科研、产品研发和项目管理经验。共发表学术论文30多篇,拥有8项发明专利。他同时还是新加坡AITREAT公司的联合创始人兼董事。

以下为本次直播精彩实录:

Atlas本身控制有哪些难点?

孙广彬:Atlas采用液压驱动,非线性会给驱动器控制带来一定困难。此外该机器人全身采用力位控制方式,加上机器人本身存在很多物理限制如关节转动范围、速度和驱动力上限以及一些任务相关的约束,这样的控制问题很复杂。

复杂约束的处理是控制或运动规划需要处理的一个重要课题。不但要满足约束,还有优化指标如能量、时间等等。还有运行够快,尽量达到实时条件。

如何将复杂问题用简单的方式处理,是一个很好的哲学观点。BD老总Marc很善于这一方面。

梁聪慧:双足类人机器人是一个超多自由度,多刚体的一个物理系统,动力学的非线性耦合非常强。在过去的二三十年里面,日本学者做了大量的工作,包括本田公司,秘密研发十多年,实现了双足步行机器人的稳定行走 跑步甚至跳跃,已经让很多学者难以望期项背。但是以往的双足步行机器人都是基于ZMP的静态平衡, Atlas是基于Marc Raiber原来在MIT leg 实验室进行的研究项目,实现动力学的平衡方式,早在二十年前就实现了单足机器人的后空翻动作。现在的atlas基于电液控制,非线性很强,控制技术难度应该相当大,包括大部分液压原件都市是定制或者自己研发,还有3D打印的液压元件和管道,应该说atlas 的惊艳后空翻,凝聚了二十多年的功力和许多工程技术人员的精力。

读者提问:Atlas最新视频中,最后“扑街”的那部分是什么没做好?是故意的吗

刘江(新智元智库专家):感觉是专门设计的,前面让人有恐怖感,最后缓和一下气氛,还能增加戏剧性和传播性,PR效果很好。

孙广彬:我认为是为了展示机器人真实的运行状态。机器人可以实现复杂功能,但可靠性或成功率还有待提高。不过迈出第一步很关键。

梁聪慧:最后的扑街就是一个彩蛋,就像你去看大片电影一样,吸引人们继续关注,也是老美技术宅们的一个娱乐或者说幽默方式,慢慢变成一种文化。

刘江:我看知乎上有做人形机器人的博士说波士顿做的已经大大超出业界其他研究机构的水平,很绝望,想问各位专家怎么评价?

梁聪慧:没有什么绝望的,我本人是比较乐观的。类人机器人要想在实际环境中完成任务还有许多的挑战,Atlas这次的video估计也是拍摄和实验了很多次才会成功,所以能做的事情还很多,大家继续加油!

孙广彬:正如梁聪慧博士前面描述,当年本田的ASIMO已经让广大机器人专家难以企及。不过多年过去,BD仍然完成了超越(最起码运动方面)。所以我认为人形机器人还有很大发展空间。

作为一个研究机器人的博士,在看到波士顿动力的最新视频时,你有什么感受?

孙广彬:两个字:惊艳!作为一个机器人工作者,能够体会到实现灵活、敏捷、稳健的全身复杂运动的难度。能够达到这样灵活的运动操控更是令人震撼。(:

其实机器人的运动控制容易给外行一个印象是,很简单,做出几个动作就可以了,照搬人类动作就可以了。实际上并非如此。人的结构、质量分布和机器人差别还是很大的,同样的动作,人可以,机器人照做是可能行不通的,会立刻摔倒。实际上,机器人不止模仿人,最终我认为一定会超越人,BD已经走在路上了。

段晋军:第一感觉是震惊,冷静后开始思考为什么BD每次都能做出惊人的视频,然后开始思考其背后的技术到底有哪些?为什么我们国内做不到?

读者提问:我想问一下,国内外的这种差距是不是因为国内大部分(不是全部)实验室主要是做应用偏多,很少有沉下心来做理论研究的,比如我现在学习的人工智能框架(TensorFlow、caffe、theano等)基本上都是来自国外的成果。

段晋军:国内的机器人技术晚于国外几十年,国外的初期研究成果聚集在九十年代,当然现在成果也很多,人家都开始用增强学习等人工智能的方法来做机器人的应用,虽然离现实工业中的应用还有距离,但是确实是在路上。除了您现在用的框架,您也可以关注近期的Gluon。

Atlas 这样的机器人,如果走进生活和工业中,可以发挥作用的地方都有哪些?

段晋军:Atlas走进生活的可能性比较小,成本太高,一台大概要200万美金。工业上也许可能性也比较小,若是能像Cassie那样(10万美金左右),还有可能性。可能会用的场合是军方。

孙广彬:我认为,Atlas这样的机器人代表了我们人类长久以来的一个梦想,也是最复杂的一类机器人。它的用途很广,比如可以用于私人陪护,机器人本意有奴隶的意思,不过我们更愿意当做长期助理或伴侣,不过这需要机器人智能化程度充分发展之后。工业上的用途我认为可以用于一些个性化加工或复杂环境中生产任务执行,这和大数据、人工智能技术等可以找到交汇点。

读者提问:为什么最后的后空翻不在实地上完成而要踩在一块板子上?

段晋军:那个应该不是板子,仔细看是海绵垫,为了做缓冲。落地后与地面接触时,接触力是非常大的,有两种控制方式,一种是被动柔顺,一种是主动柔顺。被动柔顺是靠类似于弹簧-阻尼的机构来实现,主动柔顺是靠控制来实现,可以考虑用阻抗控制。阻抗控制是Hogan1985年提出的,应用场合很多,控制效果也不错。通过视频可以看出接触面是铺有海绵垫的,所以会有一段缓冲区,即使有缓冲区,接触力也是非常大的,如何控制好接触力是难点。

在国内,是否有一些类似 Atlas 的机器人研究,与波士顿动力相比差距有多大?

孙广彬:国内很多科研单位一直在进行积极研究,比如北理、哈工大、国科大、清华、浙大、上交以及一些科研院所,可以实现快速行走、打太极拳、打乒乓球等功能,不过尚没有报道表明能够实现如此灵活的运动,我们还有一定的跟进空间。不过我国的机器人产业蒸蒸日上,我相信我们会在产业化方面大有作为。

读者提问:对于Atlas的控制效果,可以看出它是采用了纯粹的经典控制理论么?就像刚才提到的主动柔顺阻抗控制。

段晋军:可以关注DLR(德国宇航局)的TORO,全力矩控制型人形机器人

波士顿动力最新演示的视频为什么那么惊艳,你认为最难的技术点在哪?是起跳还是落地,为什么?

段晋军:难点包括起跳和落地:

  1. 起跳相比于落地,难度小一点,BD使用液压伺服系统,所以出力大,可以应对大动态、短时间大出力的动作,因此可以完成各种动作。
  2. 而落地则较为有难度,要考虑落地点的姿态和落地后的接触力。液压系统的精度相比于电机精度略差,所以精准控制难度很大。BD能精准控制落地的姿态实为难得。当然这些不仅要归功于控制工程师,更要归功于机械工程师。

落地后与地面接触时,接触力是非常大的,有两种控制方式,一种是被动柔顺,一种是主动柔顺。被动柔顺是靠类似于弹簧-阻尼的机构来实现,主动柔顺是靠控制来实现,可以考虑用阻抗控制。阻抗控制是Hogan1985年提出的,应用场合很多,控制效果也不错。通过视频可以看出接触面是铺有海绵垫的,所以会有一段缓冲区,即使有缓冲区,接触力也是非常大的,如何控制好接触力是难点。

无论是起跳还是落地,都需要进行步态和运动的规划。

孙广彬:相比较而言,我也认为是落地。落地过程需要进行冲击的处理和保持平衡,比较困难。起跳主要是提供后续空翻的旋转角动量,相比较,空翻过程中的姿态控制可能比起跳更复杂。

读者提问:柔顺已经在四足机器人上成熟了吧,所以稳控的重担会不会在姿态上?

段晋军:一般情况下,与环境或外界接触才会考虑柔顺控制。落地是与环境接触,可以用阻抗和导纳来分析。落地时的接触力可以是被动柔顺和主动柔顺的混合控制,单靠一种应该不行。原因是被动很难精准控制,而主动柔顺需要传感器感知,力过大传感器会坏掉,所以应该是两者的结合控制。

孙广彬:有一点毋庸置疑——该机器人有力控,有力反馈的机器人很多用柔顺控制,阻抗控制我个人理解用在基于位置控制的机器人多一点(欢迎专家勘误),当然其他实现方式,如将状态空间正交分解,在不同的空间纬度控制力和位置,力位混合控制一种。

波士顿动力Atlas机器人后空翻的技术原理是什么?

段晋军:这里指Atlas起跳后,先不考虑是如何起跳的,假设已经有足够的动力使得Atlas完成空翻动作。起跳后的Atlas在飞行过程中,类似于我们通常说的抛物线运动,也就是atlas的COM(center of mass)是有固定运动轨迹的,但是可以改变自身的姿态,也就是可以绕着COM完成各种动作,比如空翻等。空翻过程根据动量守恒原理,可以通过脚和手的位置来改变姿态旋转的角速度,仔细观察跳水运动员就可以发现。(此处可以加一个抛物线运动的示意图)翻转时要考虑落地时是符合落地要求。

当然在翻转过程中,COM是动态变化的,简化为抛物线运动是便于理解,实际控制中难度非常大。

孙广彬:我认为Atlas复杂空翻可以分解为跳跃和翻转两个基本动作。通过这两者组合,实现了视频中跳跃、原地跳跃转身180度、和跳跃空翻等动作。

跳跃包括原地跳和移位跳,原理类似,无非是控制横向运动不同。跳跃动作需要对整个运动过程进行规划,并进行实时精准的控制,尤其在起跳和落地瞬间,确保按照目标轨迹起跳、飞行和落地,并进行力控以保证软着陆,落地后还要进行动态平衡控制,防止摔倒。

翻转主要依靠对关于质心角动量的调控来实现。必须与跳跃的周期协同。起跳瞬间,依靠地面反力是可以产生一定的角动量,在空中飞行时,遵循角动量守恒(因为没有外部力矩作用)。那么在空中可不可以调节姿态防止脑袋着地呢?答案是肯定的。有一个著名的Falling Cat实验(落猫),就是抓一只猫,离开地面并保持四脚朝天状态,然后放手,无论如何丢,猫最终总是会空中翻转然后用脚着地。当然,这并没有违背角动量守恒。猫可以利用身体丰富的冗余自由度,即使角动量不变,也可以调整姿态。当然机器人也可以。不过Atlas有没有利用Falling Cat原理,不得而知,我倾向于认为有利用类似的机制。

综上所述,这里涉及到了多种动力学的概念如:角动量守恒、Falling Cat等;还涉及到了多种机器人技术如:运动规划、力控制、平衡控制等,其实还有个最优化在里面。即使简单的走路、跳跃,也会涉及到很多这样的技术。

最后一个问题,总结和预测,波士顿动力接下来还会出什么黑科技?会侧重哪些方面?

段晋军:哈哈,这个问题比较难啊,Marc Raibert团队的想法一般都超于常人,不敢去断言,只能默默地等待,下一次一定也是惊艳的~

不知道会不会像Pieter Abbeel和Sergey Levine的团队一样,融合人的技能进去,实现类人的行为,让Atlas有了思维能力。(此处不是技术问题,请允许我吹吹牛皮)

孙广彬:我认为(猜测)Atlas目前有如下可以改进之处:

  1. 技术移植到电动版本机器人
  2. 解决能效问题以及能量存储问题
  3. 提高可靠性,降低成本,促进产业化。
  4. 继续提升能力,将人类越甩越远。

第一个问题可以参照大狗向spot及mini的转化。很可能人形机器人也有类似套路。第二个问题是移动机器人的共有问题。不过电能存储技术如超级电容或快充技术等已经在改善这个问题,相信不久的将来能够实现大密度移动电能(前提是如果atlas的后代使用电能)。第三个问题因为缺少可靠性的一些展示,所以这是自然的怀疑;高成本和低产业化特点也导致了BD被阿尔法(谷歌母公司)出售,BD的这些短板在制约其走向市场。第四个问题,我个人认为,机器人一定会超越人类很远很远,所以这条路还会走下去。

对以上做个预测可能性排序: 1 4 2 3。

林思恩(新智元智库专家):每一次成功的BD除了技术的领先,还有牢牢抓住技术所能给人带来的冲击效果,拿Boston Dynamic的空翻来说,创始人20多年前造的机器人就已经会空翻了,但是并没有那么惊艳,真正让这次的机器人空翻产生惊艳效果的,是ta的人形外观、仿体操动作、和平衡重心时的与人类似的体态。知道技术能做什么,做什么更好,是PR的核心竞争力。

段晋军:Kuindersma S, Deits R, Fallon M, et al. Optimization-based locomotion planning, estimation, and control design for the atlas humanoid robot[J]. Autonomous Robots, 2016, 40(3):429-455. 这篇论文讲了Atlas的很多细节,包括运动规划,动态运动规划,控制器设计,信号处理等等。


原文发布时间为:2017-11-21

本文作者:新智元V享圈

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【V直播】三专家解读波士顿动力Atlas惊艳后空翻7大技术难点

相关文章
|
6月前
|
人工智能 开发者
"使用PAI实现涂鸦变大作"AIGC活动重磅来袭!
使用PAI-DSW搭建Stable Diffusion XL Turbo完成AI画画功能,轻松实现随手涂鸦变精美画作,人人都可当AI画家!诚邀AIGCer参与挑战,沉浸式体验云上绘画AIGC创新之旅。制作上传专属美画,即有机会抽取Powerbeats Pro、台式升降桌等七重奖品!
|
6月前
|
人工智能 自然语言处理 计算机视觉
TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
【2月更文挑战第3天】TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
88 1
TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
|
6月前
|
人工智能 小程序 算法
探索AI动画与小程序的应用创新-产品面对面系列直播第四期
探索AI动画与小程序的应用创新-产品面对面系列直播第四期
123 6
|
机器学习/深度学习 人工智能
体育赛事转播平台开发搭建,技术扩展瞄准AI解说功能
"随着体育赛事的蓬勃发展,每年都有大量的体育比赛视频呈现给球迷,其中不可能所有视频都能得到人工解说。这正是AI语音解说的大展拳脚之地。
|
机器学习/深度学习 人工智能 编解码
火山引擎 技术开年:视频云与AI的两翼齐飞
火山引擎 技术开年:视频云与AI的两翼齐飞
|
开发框架 JavaScript 前端开发
梦幻体育赛事直播系统的解决方案和技术分析
以确保用户能够享受到流畅的直播体验,梦幻体育赛事直播系统需要采用一个可靠且高效的解决方案,以下是我们对该系统所需的技术和框架的分析。
梦幻体育赛事直播系统的解决方案和技术分析
|
Cloud Native NoSQL 关系型数据库
对话李飞飞,揭秘国际体育赛事风“云”背后的黑科技
众所周知,在重大体育赛事中,如何提高运动员的成绩,如何改善观众的参与体验,是体育组织越来越重视的问题。那么阿里云技术是如何帮助解决这个问题的呢? 今天,我们有幸邀请到阿里巴巴集团副总裁、阿里云智能数据库产品事业部负责人、ACM杰出科学家李飞飞为我们揭秘国际体育赛事风“云”背后的黑科技。
1014 0
对话李飞飞,揭秘国际体育赛事风“云”背后的黑科技
|
人工智能 算法 Cloud Native
独家发布 | 阿里洞察:AI 还香吗?《中国企业2020》系列报告第二季免费下载
人工智能正在降温?AI企业盈利仍很困难?2020 年最具产业价值的 AI 领域又有哪些?身在产业中的你如果也有这些疑问,那么这本《人工智能红利渗透与爆发》或许能解答你的疑惑。阿里云研究中心联合埃森哲 ——《中国企业2020》系列报告再出新视野,带你了解人工智能正在发生的科技浪潮。
18160 0
独家发布 | 阿里洞察:AI 还香吗?《中国企业2020》系列报告第二季免费下载
|
Cloud Native 架构师 双11
【1109 - 1113直播导视 | PPT 下载】开源日再度来袭:实时计算技术的最新探索成果和实践、今年双11究竟有啥黑科技?
本周4个专题页重磅推荐,直播&前沿技术知识两不误,分别是双十一技术回顾&亚洲最大的开源关系型数据库生态大会PostgresConf.CN&数据库&开源日,块办好小板凳前来观看吧!
2788 0
下一篇
无影云桌面