Robotics 2.0:AI重新定义机器人

简介: 提到机器人,我们总有各式各样天马行空的想像:从Softbank(软银集团)的社交机器人Pepper、能轻松后空翻的Boston Dynamics公司机器人Atlas、《魔鬼终结者》(Terminator)系列电影的人造人杀手,到电视影集《西方极乐园》(West World)中随处可见、栩栩如生的拟真机器人角色。

提到机器人,我们总有各式各样天马行空的想像:从Softbank(软银集团)的社交机器人Pepper、能轻松后空翻的Boston Dynamics公司机器人Atlas、《魔鬼终结者》(Terminator)系列电影的人造人杀手,到电视影集《西方极乐园》(West World)中随处可见、栩栩如生的拟真机器人角色。


我们常常听到两极化的观点;有些人倾向高估机器人模仿人类的能力,认为机器终将取代人类,有些人则对新研究和技术的潜力太过悲观。

微信图片_20211224143318.jpg

在过去一年之中,许多创业、科技、新创业界的朋友都曾问过我,在AI,尤其是深度强化学习和机器人技术的领域,究竟有哪些「实际」进展?


令人最为好奇的是:


AI机器人和传统机器人有什么不一样?AI机器人是否真有颠覆各大产业的潜力?它的能力和限制又是什么?


看来,想要了解现在的技术进步和产业格局,是出乎意料的困难,更不用说要对未来做出预测。藉由这篇文章,我尝试揭开人工智慧应用于机器的神秘面纱,厘清这个我们常常听到,但却着墨不多、或根本未全然理解的主题。


首先必须回答的基本问题:什么是AI机器人(AI-enabled Robotics)?它们又有什么独特之处?


机器人演进:从自动化到自主化


「机器学习解决了以往『对电脑困难,对人来说却容易』的各种问题,或以更容易理解的方式来说,就是解决了『人类很难让电脑也理解』的问题。」

— — Benedict Evans,安霍创投(a16z)


AI所造就的机器人技术领域,最大成果是从原先的「自动化」(工程师藉由程式设计编写规则,让机器人遵守)迈向了真正的「自主学习」。


如果机器人只需要处理一件事情,那么,它到底有没有人工智慧,差别其实看不出来;但是,如果机器人需要处理各式各样的任务、或是回应人类与环境的变化,就需要一定程度的自主性才能胜任。


我们不妨借用下列不同等级的自驾车定义,一并解释机器人的演变:


  • Level 0 —无自动化:由人类操作机器,没有机器人的参与。(机器人的普遍定义,是指有能力自行从事复杂动作的可程式化拟人机械)。
  • Level 1 —单一自动化运作:单一功能已自动化,但不使用环境资讯。这是自动化与制造业中传统的机器人使用现况。透过程式编辑,机器人能够以高精度与速度重复执行特定工作;但直至目前为止,多数实际运用的机器人都无法感知或应变环境的变化。
  • Level 2 —部分自动化:透过环境感知所输入的特定功能,协助机器进行决策。例如某些机器人透过视觉感应器,识别并应付不同的对象:然而,传统的电脑视觉,需要对每个对象进行预先登记和清楚的指示,且机器人还是缺乏处理变更、意外状况、或是新对象的能力。
  • Level 3 —条件式自主:机器控制了所有的环境监控行为,但仍需要人为检查关注与(即时)介入。
  • Level 4 —高度自主:在某些情况下、或是定义的区域内完全自主。
  • Level 5 —完全自主:在任何状况下均可完全自主,不需人为介入。


我们现在处于哪一种自主等级呢?


现在,工厂里多数机器人都是透过开放式回路、或是非回馈方式予以控制。这意味着它们的运作与感测器回馈各自独立、彼此互不影响(level 1)。


少数在工厂中的机器人,会根据感测器回馈而调整操作(level 2);此外还有协作型机器人(cobot),他们的操做更加简单安全,因此能与人类共同作业。然而,相较于产业用机器人,这种机器人的精确度和速度却相形失色。另外,虽然协作型机器人的程式化相对简单,但它们仍然不具有自主学习性;每当工作内容或环境有所变动时,就需要由人类手动引导协作机器人进行调整,或是重新编写程式,机器本身无法自主举一反三,弹性应变。


深度学习(Deep Learning)和强化学习(Reinforcement Learning)能帮助机器人自主处理各种物件,将人类的介入程度降到最低。


我们已经开始看到一些使用AI 机器人(level 3/4)的前导试行专案,例如「仓储拣货」就是一个很好的例子。在货运仓库中,员工需要根据客户需求,将数百万种不同的产品放入箱子里。传统的电脑视觉没办法处理如此广泛的物品类别,因为每个物品都需要事先登录、并针对机器人需要采取的动作,先进行程式设计。


然而,现在由于深度学习和强化学习技术,机器人能够开始自主学习处理各种物件,降低人类的介入程度。在机器人的学习过程中,可能会出现它未曾遇过的某些货品,而需要人类的协助或示范(level 3)。但是,随着机器人搜集更多的资料、从试验和错误中学习(level 4),演算法也将日益改善,迈向完全自主。


就像自驾汽车产业一样,机器人新创公司也采取了不同的策略:有些公司看好人类和机器人之间的合作,专注于level 3的研发;有些公司则相信,机器终将实现真正的完全自主,于是他们跳过level 3,直接着眼于level 4、甚至到level 5。


这也是为什么我们很难评估现在产业自主程度的原因之一。


新创公司有可能自称致力于研究level 3/4的自主系统,但实际上却是大量委外,以人工远端操控机器。在无法了解其内部软体及AI产品发展程度的前提下,光从机器外观看不出远端操控和自主学习的差别。另一方面,目标为level 4/5的新创公司,万一无法在短时间取得理想结果,可能反而降低了客户的早期采用意愿、并导致早期阶段的资料搜集更加困难。


在本文的后半部分,我将进一步讨论新创公司的不同的商业策略思考。


AI机器人的崛起:运用范围不再局限于仓储管理


有趣的是,机器人的人工智慧应用潜能甚至高于无人车,因为机器人有各式各样的应用与产业,因此从某种意义上说,机器人理当比汽车更容易实现level 4目标。


AI机器手臂开始在仓库中被采用,就是最好的例子。因为仓库属于「半受控」的环境,不确定性相对低。另外,拣货作业虽然关键、但能容许错误。


至于自主居家型或手术机器人,则要等到更遥远的未来才能实现;毕竟相关环境的变数更多,且有些任务具备不可逆性,以及一定程度的危险性。但是,可以预见的是,随着技术精度、准确性、可靠性的与时俱进,我们将看到更多产业采用AI机器人。


许多产业还没有使用机械手臂,主要原因在于传统机器人和电脑视觉的限制。


目前世界上只有大约300万台机器手臂,其中大多数从事搬运、焊接、装配等任务。到目前为止,除了汽车业和电子业以外,仓储、农业和其他产业,几乎都还没有开始使用机械手臂;主要原因,就在于上述传统机器人和电脑视觉的限制。


在接下来的几十年中,随着深度学习(DL)、强化学习(RL)、以及云端技术释放出的机器人潜力,我们将看到新一代机器人带来的爆炸式增长、并改变产业格局。其中,AI机器人的成长契机有哪些?新创公司和现有业者,又采取了哪些不同的方法和商业模式,来因应新科技带来的变化?


新世代AI机器人新创公司产业概况


接下来,我会介绍不同市场区隔中的几间范例公司。这样的概略介绍,当然无法涵盖所有企业的状况;欢迎你提供其他公司及应用案例,一起让内容更加完备。


微信图片_20211224143814.jpg


AI/Robotics新创公司市场概况(作者提供)


垂直应用与水平应用


研究新世代机器人新创产业结构,可以看到两种截然不同的商业模式。


垂直应用


第一种是垂直应用:矽谷当地多数的新创公司,专注于为特定的垂直市场开发解决方案;如电子商务物流、制造业、农业等等。


这种提供完整解决方案的作法相当合理,毕竟相关技术还处于萌芽阶段;公司不依赖他人提供关键模组或元件,而是建构端对端的解决方案。这种垂直整合的解决方案能更快进入市场,也能确保公司更全面掌握终端使用者的案例与效能表现。


但是,要找到像「仓库分拣」这样相对容易实现的应用案例,则没有那么容易。仓库拣货是相对简单的工作,客户的投资意愿与技术可行性都较高,而且每个仓库几乎都有相同的拣货需求。


但在其他产业(如制造业)中,装配任务可能因工厂而各不相同;另外,在制造业中执行的任务,也需要更高的精度和速度,技术上相对困难。


目前具有学习能力的机器人,仍无法达到与封闭回路机器人相同的精度。


尽管机器学习能让机器人与时俱进,但目前透过机器学习运作的机器人,仍无法达到与封闭回路机器人相同的精度,因为它需要累积尝试错误的经验,从错误中学习,逐渐进步。


这点说明了为什么MujinCapSen机器人这样的新创公司,并未采用深度强化学习,反而选择使用传统电脑视觉。


然而,传统电脑视觉要求每个物件都要事先登录,终究还是缺乏扩充和适应变化的能力。一旦深度强化学习(DRL)达到了效能门槛、逐步成为产业主流,这种传统方法终究会变得无用武之地。


此外,这些新创公司的另一个问题,在于它们的价值往往遭到高估。我们经常看到,新创公司在矽谷筹集了数千万美元资金,却无法承诺创造出任何真正具体的收入流。


对于创业者来说,「描绘」深度强化学习的美好未来,再容易也不过了;但现实则是,我们还需要数年的时间才能达到如此的成果。尽管这些公司离创造获利还有一段距离,矽谷的创投仍愿意继续押宝在这些人才优秀、技术先进的团队上。


水平应用


另一方面,水平应用则是更实用、却比较罕见的模式。我们可以简单将机器人技术简化为感测(输入)、处理、驱动(输出)三个部分;除此之外,还有开发工具。(这里使用的「处理」一词,同时概略涵盖了控制器、机器学习、作业系统和机器人模组等等,各种不属于感测或驱动的其他项目。)


我认为未来,这个领域将最具增长潜力。对于机器人的用户来说,破碎而零细的市场是棘手的问题;因为所有的机器人制造商,都各自推展自家开发的语言和介面,使得系统整合商与终端使用者,都很难将机器人与相关系统进行整合。


随着产业的逐渐成熟,有越来越多机器人应用到了汽车和电子厂以外的领域;因此我们更加需要标准的作业系统、通讯协定、介面,从而提高效率、并缩短上市时间。


举例来说,美国波士顿的几家新创公司正在研究相关的模组;例如Veo Robotics公司开发的安全模组,能让工业机器人更安全地和人类协同工作;Realtime Robotics公司则提供加速了机械手臂路径的解决方案。


Bastiane Huang目前在旧金山担任AI/Robotics新创公司OSARO的产品经理,专注于开发机器学习软体,用于机器人视觉和控制。她拥有近10年产品及市场开发管理经验,并在美国《机器人商业评论》及《哈佛商业评论》发表文章及个案研究。


相关文章
|
2月前
|
机器学习/深度学习 人工智能 自动驾驶
2024.10|AI/大模型在机器人/自动驾驶/智能驾舱领域的最新应用和深度洞察
本文介绍了AI和大模型在机器人、自动驾驶和智能座舱领域的最新应用和技术进展。涵盖多模态大语言模型在机器人控制中的应用、移动机器人(AMRs)的规模化部署、协作机器人的智能与安全性提升、AR/VR技术在机器人培训中的应用、数字孪生技术的优化作用、Rust语言在机器人编程中的崛起,以及大模型在自动驾驶中的核心地位、端到端自动驾驶解决方案、全球自动驾驶的前沿进展、智能座舱的核心技术演变和未来发展趋势。
58 2
|
14天前
|
存储 人工智能 搜索推荐
AI智能语音机器人的基本业务流程
简介: 先画个图,了解下AI语音机器人的基本业务流程。上图是一个AI语音机器人的业务流程,简单来说就是首先要配置话术,就是告诉机器人在遇到问题该怎么回答,这个不同公司不同行业的差别比较大,所以一般每个客户都会配置其个性化的话术。话术配置完成后,需要给账号配置线路,目的就是能够顺利的把电话打出去。线路配完后,就是建立任务了,说白了就是导入电话号码,因为资源有限,不可能导入一批立即打完,所以需要以任务的形式分配给机器人,然后机器人逐个完成。值得一提的是,如果有多条线路,创建任务时建议提供线路选择功能,很多公司的业务不止一个城市,而大家又是比较习惯接听自己所在城市的电话,所以这个选择主
|
2月前
|
机器学习/深度学习 传感器 人工智能
马斯克的AI机器人可以拯救一个陷入困境的教育系统吗?
马斯克的AI机器人可以拯救一个陷入困境的教育系统吗?
|
2月前
|
人工智能 搜索推荐 机器人
挑战未来职场:亲手打造你的AI面试官——基于Agents的模拟面试机器人究竟有多智能?
【10月更文挑战第7天】基于Agent技术,本项目构建了一个AI模拟面试机器人,旨在帮助求职者提升面试表现。通过Python、LangChain和Hugging Face的transformers库,实现了自动提问、即时反馈等功能,提供灵活、个性化的模拟面试体验。相比传统方法,AI模拟面试机器人不受时间和地点限制,能够实时提供反馈,帮助求职者更好地准备面试。
63 2
|
2月前
|
人工智能 算法 前端开发
无界批发零售定义及无界AI算法,打破传统壁垒,累积数据流量
“无界批发与零售”是一种结合了批发与零售的商业模式,通过后端逻辑、数据库设计和前端用户界面实现。该模式支持用户注册、登录、商品管理、订单处理、批发与零售功能,并根据用户行为计算信用等级,确保交易安全与高效。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI战略丨物流 AI 新变化,用大模型定义
物流企业在大模型上纷纷主动探索,也在推动物流行业实现智能化加速。
|
4月前
|
人工智能 测试技术 持续交付
就AI 基础设施的演进与挑战问题之定义应用的交付模式的问题如何解决
就AI 基础设施的演进与挑战问题之定义应用的交付模式的问题如何解决
|
4月前
|
人工智能 分布式计算 大数据
大数据及AI典型场景实践问题之“开发者藏经阁计划”的定义如何解决
大数据及AI典型场景实践问题之“开发者藏经阁计划”的定义如何解决
|
5月前
|
人工智能 自然语言处理 机器人
客户在哪儿AI的ToB获客服务和AI外呼机器人的有何不同
客户在哪儿AI的ToB获客服务 VS AI外呼机器人的ToB获客服务。
|
4月前
|
人工智能 自然语言处理 安全
盘点国内:AI写作助手_ai智能问答机器人
AI写作助手是利用人工智能技术,特别是自然语言处理(NLP)技术,来辅助用户进行写作的工具。这类助手通过分析大量文本数据,能够理解语言的结构和含义,从而生成、编辑或优化文本内容。AI写作助手通常具有自动纠错、语法检查、内容生成和风格调整等功能,帮助用户提高写作效率和质量。

热门文章

最新文章