机器人和人工智能——从现在看未来-阿里云开发者社区

在8月13日的云栖TechDay创投专场上，可可资本副总裁李笙凯为大家分享了《机器人和人工智能——从现在看未来》话题。可可资本副总裁李笙凯首先分享了全球工业机器人市场规模，同时解释了全球服务机器人市场快速发展的原因；其次，还分享了深度学习和人工智能的区别及图像识别应用领域；最后，分享了其团队投资逻辑的三个方面：工匠团队、技术沉淀及市场刚需。

以下是现场分享观点整理。

大家好，我来自可可资本，主要看的是机器人和人工智能方向。从去年到现在为止，我们基金应该是国内对这个领域最关注的，投资的金额大概在1亿+。所以我今天会比较侧重于从产品市场或者从投资角度看机器人和人工智能这个领域，从现在怎么看未来。但这个仅代表个人观点，不代表这个市场真正未来的样子。因为只能从我看到的领域和角度来讲解我的一些观察的结果。所以可能讲的会有些枯燥，请大家多多包涵。可可空间也是我们做的，就像刚才介绍的一样，我们的模式是孵化+投资。我们希望培育很多年轻的创业者或者说企业家跟我们一起成长，所以我们的基金主要面向于早期投资，一般是天使到A轮之间。

今天我不仅讲人工智能，还要讲我们从机器人到人工智能，怎么从现在看到中国以及世界上的趋势，未来可能会有什么样的地方去生产。所以我现在不太想聊人工智能的看法，因为我们在这一块刚刚开始，所以我们是希望在做好之后再去沟通。今天主要是和大家分享一下我目前的看法和想法。

全球工业机器人市场规模（中国2015年销售量达到7.5万台）

简单的提一下我们对机器人整个行业的概括。从2014年开始，机器人在中国很火，我们是从2013年开始思考这个问题的。大家平时看到的都是工业机器人，就是说在中国资本市场比较火的其实是工业机器人。在这块我们有所布局，如并联机器人以及这种串联的scara型等主要用于快速分拣、替代轻工和高效装配的工业机器人；以及我们国内的资本市场最贵的机器人公司，其主导的产品我们叫AGV的物流机器人；以及全世界机器人最贵医疗机器人的主导公司出产的一台可能要2千万美金的机器人；或者去年开始比较火的大疆无人机；又或者说我们国内目前已经销量第一的家庭服务机器人，也是我们目前总需要的机器人——扫地机器人；或者春晚时候优必选的人型机器人；以及最后我们可以看到的让人提高运动效率的外骨骼机器人，这些机器人都是以硬件为着手的机器人。

630e212e81586d49c470e10335b807fb50982838

全球服务机器人市场快速发展

很多机器人都需要人工智能这个载体去介入，能够达到我们预想中的机器人能够完成的方式，因为之前在工业机器人都有布局。但其实未来想象空间是自动化做替代，所以这块市场就是更庞大的自动化市场，所以现在工业机器人的数量还是只有几十万台，但未来可能会出现几百万台。目前来讲，就算是原本的工业机器人的市场在全球都是10%的增长，中国更是在过去的15年中，已经达到平均每天40%以上的增长。所以机器人在中国的市场需求增速是非常快的，很多厂家也是看到增量空间潜力比较大，所以试着对这一领域采取行动。那这背后又有什么原因呢？就是普通服务机器人为什么他们会有发展？

宏观来讲，主要有三个方面。第一个方面，我们可以从经济原因来看，我们中国市场已达到中等收入的状态，所以我们需要提高生产效率。可能大家没有到实际生产现场去看，无论大家所知道的富士康，美的电器或汽车行业等，很多行业的生产效率是非常低的。就是说我们知道的有些很好的产品，甚至在富士康里面，一次性完成的只能占比2%。也就是说，大家目前的很多生产都是人工来做介入的，但这样的低成本劳动力的生产效率是比较低的，所以需要这样的自动化设备或者机器人的介入，来提高生产效率。

现在新的产品要靠产品本身迅速把市场占领，已经不太可能了。除非是新兴的产品，就像现在大家已经不再以纯粹的苹果，而需要更多的个性化的产品，荣耀或者是说其他的产品出生的时候，个性化就会对所有的终端产品提出各种各样的要求，机器人是我们看到的在批量化生产，但能够适应多种行业的需求的一个产品。所以这个个性化的需求是必备的生产线要素之一，我们这个工业机器人的需求比较明确的。

第二个方面，在技术和产业这一块，机器人在全球发展了40多年，目前，我们所知道的四大家族的机器人生产都往中国迁。ABB所有机器人的生产都迁到国内来，所以我们可以看到国内的机器人的产品也随着这十几年的发展，包括从外资里面的培育出来的人，包括我们中国的院校的发展，机器人的产业已经逐渐成熟。甚至我们都有一些厂家能够生产出核心的产品，这包括，减速机、驱动器和控制柜，这些东西都都能代表中国机器人产业的成熟。

人工智能的快速发展，其实机器人的运动就像人体的关节一样，我们要他怎么去动得更有效或高效，都需要大量的数据去做大量的分析和解析才能知道怎么做得更好，一方面是理论方面的知识，另外方面是数据方面的解析，这一块需要人工智能的快速发展，也包括我们互联网技术的。在我们团队看到的中国互联网技术在世界上都是数一数二的，我们现在看到人工智能很多很好的团队，就像这几年行业内知名大赛的获胜团队，基本上都是中国人的影子，所以中国的在这一块的发展是比较快速的。

第三个方面是社会和政策，50年代的时候，美国的机器人新发展起来，但是美国的由于担心机器人替代了人工会使得社会的劳动力的下降，所以压抑了工业产业的发展。但日本反而去支持这个产业，所以到今天为止，四大家族有两家是日本的。我们可以看到除了一些特定的市场应用或者技术前沿性的产品，像达芬奇，或者是KIVA这套系统，其他在美国都发展不起来。

从我们的角度来看，服务机器人能够发展起来主要有两个方面的因素，一方面就是说市场，市场有需求，我们可以看到人力成本、劳动力的缺口、老龄化的需求及独居老人，因为陪伴包括守护儿童这样的各种情况，机器人满足了家庭或企业服务市场的这些需求。另外一方面技术，我们可以看到，像人工智能的技术的发展，使机器人的这块市场使用起来开始逐渐达到一定的能被我们所期望的情况。这包括语音和括图像导航定位，这样的一些解决方案使得我们看到这些技术逐渐成熟，并且认为在这些领域是有需求和市场的。其实机器人大家可能都不清楚，目前我们在市面上绝大多数的服务机器人，你把他放到家里他是不知道在哪里，他只能用Ipad或者手机去操控操作，这包括无人机，我们现在市面上绝大多数无人机是操控型。而要让无人驾驶汽车，目前来讲市面上很多东西没办法让机器人自己知道在哪里。就像人一样，我把你丢在一个陌生环境，你要知道你在哪里，才能去找到你要去做的东西在哪，而激光雷达在google的无人驾驶的汽车，NASA月球车实际上都是同类型的技术。之前这个产品的市场价格基本上在三万以上，单台的部件的价格，所以很多时候这种产品的价格不太适合这个服务机器人去用，或者扫地机器人。因为一台扫地机器人可能也就千元最多也就去万元，大家能够承受的极限了。那如果一个核心零部件跟你说三万元大家都会弃我们的方案，但也没有其他的可替代的方案能使得机器人做的这么智能。思岚科技的雷达他是这样的功能，使得机器人知道自己家庭的定位自动去规划扫地的路径，同时可以自动规划行走的路径和方式，也把这个成本从3万降到千元左右，这样的一个产品，就是说有些时候无论是讲到人工智能或者机器人其实我们现在所看到的问题都是要替代人并没有大家想象中的这么难。但就是在于成本的问题，大家可能不清楚，像AlphaGo需要3万台以上计算机的支持才能替代一个人，那我们在一般地通用领域怎么让这么多台设备去支持一样东西？所以性价比是一个阻碍很多核心产品发展的问题，这包括可能大家都之前都了解过的波斯顿动力，这家美国很有名的机器人公司，他的第一代设备是以千万以上的价格出售的。所以他的成本基本上也是在这个体量，所以很难想象我们要买台家庭的服务机器人到千万以上的，他要做到什么样的工作，你才会愿意接受买他回家。所以很多时候技术的发展包括产品化的发展都需要把价格和性价比的优势能够体现起来，才能够使得产品落地和开花和结果。

人工智能（深度学习和人工智能的区别）

简单来说，人工智能的发展就是希望机器人像人类一样思考，也像人类一样能够听得懂看得懂。你要一台机器人能够跟你交互，他需要看到你所处的环境，要让他做事情的时候，无论是拿个杯子可能大家会想象中是一个很简单的事情，但你让开放环境让他去找这个杯子，而这个杯子可能形状不一定很规整，机器人识别杯子是方的圆的是非常难的。从我自己的角度来看，目前我们看到的机器人，人工智能能够解决的范畴可能是说某些特定的场景下，让机器人解决听得懂和看得懂的话题，对于通用的平台集中我们不是特别看好，因为现在目前的技术没办法解决到通用的话题上面，包括运动控制也是一样。为什么说波斯顿动力的机器人让大家这么兴奋呢？是因为他解决了要以足来行走的机器人的这种方式，这为什么会有价值呢？是因为大家可以发现在家庭的环境下，你有线缆你有台阶可能还有物体堆在地上，这个时候你要机器人跨过这些障碍物去走到另外一个地方，滚轮是没办法解决的，就是目前动力源和机械动力的方式使得要像人类一样的行走是非常难的。大家可以想象一下，如果一台机器人30公斤重，他在背一台30公斤的电池，行走一个小时，基本上一个小时和一个半小时就是他的极限，所以很多时候要让机器人像人类那样运动，去年Nature曾经提出有一篇文章关于用人体动力学的方式，一般来讲人要抬腿的时候才需要动力。放腿的时候可以把力反馈回去的。开始有这种方式可以解决动力源和这个人体动力学通过生物学的角度来解决这种机器人运动控制的方式，这个技术在已发表的但还有限制框架，到实际使用起来还有差距。就是说怎么收怎么放都对控制这一块有强大的要求。人工智能的发展，大概是在2013年的时候，之前的过去10年，大家会认为人工智能的发展进入一个平静的模式。

df0d2f927415ad5812015b2d861809afa8d1c801

那时候普遍用的是模式识别的方式，深度学习的最根本区别在于什么呢？举个例子，就跟小孩学车一样：就像学习“什么是车”，我们一般会说这有四个轮子，这有一个车停在外面，这样是一个车，但从深度学习的时候有500张的图片。用深度学习的方式去学习什么是车而不我们教给他的车的框架，车跟人一样，怎么识别人脸。可能从模式识别角度，已经标准出来，我有耳朵，耳朵怎么去评判，鼻子大小怎么评判，眼睛的宽度怎么评判，这是过去模式识别上面，2013年之前，大家采取的比较经典的机器学习方式就是模式识别，是通过我先标注的识别点，让机器人学习怎么去识别。但现在新的方式，把图片仍进去，我说这个图片跟这个图片像，让机器人自己去学习这个人怎么去辨别怎么去拼盘，所以深度学习为什么说是有一定的技术改革，甚至说是革命性的一种机器学习的方式也是在于这个原因。可能识别的点会比我们想象中多很多，他会像人一样，使得识别的效率要超过人，便成了一定的可行性。这是我们现在所看到的一些，同样机器学习的所能达到的效果，就是机器识别会比同样让一个训练有素的人效率和精度更高。这个机器的学习这种性能是可以使用起来的，整个人工智能的市场是非常庞大的。在于企业的数据这块所带来的价值一样，就是说2020年可能说机学性可能会创造出超过万亿美金，就是接近万亿就是千亿美金以上的市场价值。所以使得很多人对这个机器学习和大数据有研究和探讨。那其中图像和语音语义是最大的分类。我们可以看到每年新增的图像数据，那这1万亿张图片如果人去识别产生多少价值？基本上让每张图像快速的识别出来，把他这个打上标注都是一个很困难的事情，所以他的价值空间是比较小的。因此需要通过机器学习的方式能快速提高识别的效率，才能够产生实际的价值。

图像识别应用领域

这个就是我们之前说的，为什么未来可能说大家想象图像识别和语音识别会超过人脸？会超过文字检索的方式？那这样产生市场的价值就是把再造一个谷歌或者百度，我们会有一种新的生存方式，使我们对于这个识别的时候可以更有效更好的去识别。这一块的效果都是取决于产品的特性，如果产品本身更讲究图像的效果当然还是图像识别好，但如果产品是一个标准化产品，像目前的所有的电器产品，那这种东西一般都是文字识别就行了，机器学习一般会分成这边下面两样，都主要讲的是计算机视觉和深度学习的框架，就是计算机视觉我们会分成从检测到分类匹配。

43e3e0694c1b9a7ecfb6d983c0adc92750ab9ab7

目前我们在市面上强调可能是99%的准确率。但其实都是在解决某一个环节的问题而已，为什么？简单来说，什么叫检测？检测到这张图片上面有没有一样东西存在。大家会想到，如果能够准确率到90%多，这个是一个很高的准确率。实际上你可以想象一个事情，在市面上绝大多数的头像是没有大分别的，只要全部回答不，基本上90%以上。所以真正做到检测，对这个图像的识别，做比赛的图像和拿来做识别的头像可能真的需要要求的是完全很高的。所以就目前我个人的判断，深度学习或者机器视觉能够解决一些问题。但如果放到一个通用的领域，真的在你想找的东西是比较困难的，第二个就是深度学习的特征点标注，这个为什么说好？就是最重要的就是后面的特征，特征数可以无穷大，让机器去判断去选特征，但这个解决的问题是最前面的问题，深度学习的好处是一张图片，他能够帮我快速的标注好，成本降低的标注好，因为我们现在的问题在于市面上有很多的图片，但这个图片怎么把他分门别类归类，这都是比较难的问题，分门别类检测到了我给他做一个标准，但这个有些时候通用问题找杯子找笔记本，你在相对比较大的图像是比较好解决的。

但如果一旦相对模糊的图片要怎么做标准？这个其实可能很多目前为止大家能解决的技术，都是在于刚才说的人像这块，我有公安的数据以后，我能解决的标注问题是非常简单的，因为这个头像特征非常一致，就是说都是正脸都是有耳朵有眼睛有鼻子，他能够解决标注是相对比较容易的。可能说图像收集上有误区的，有特征标注的问题的时候，这个会对数据库的积累和壁垒的形成障碍，这块是深学习和数据，他的应用领域可能更多的大家都在看的安全放和金融支付，这两个是目前深度学习、机器视觉这一块。大家可能觉得比较有价值的领域，为什么呢？第一个在中国市场，甚至全球市场都是一样的，政府更愿意去买单，这种信息的科技包括军事包括安全，更容易去买单。这个市场价多大？这个可能说大家描的厂家可能有几百亿的市场，这块市场如果能拿下，可能价值就很大了，这种就安全防护。另外就是金融支付，只要跟金融挂上钩，我用人脸识别一下，远程登陆或者ATM区块，大家可以发现就是说他们目前所采用的方式跟我所提到的一样，你需要在特定的光源下，给你进行正面的拍照，才能准确。

4aba1e2523e7c02a1ef538099aa9330346a0e742

所以很多时候为什么说深度学习或者涂鸦学习没有办法直接应用也是这个问题，因为数据太大，对比的频率太高，准确率一般稍微低点这个很难。就是说应用起来，所以这块也是为什么我们会觉得这个市场很庞大但是目前来讲能用的东西还是不是特别的多。或者像下面的图像搜索、视觉交互，那视觉交互可能跟机器人更相关，就刚刚我提到的机器人能够给你去做对话，能够知道曾经想象的空间，一个应用场景，你在家里，买一台这个机器人，这个机器人他能够识别你是妈妈你是爸爸你是儿子，这种视觉交互目前为止比较难，反正这个很多时候大家都想象中能不能从背影中看到你，这样是不是更好玩，这种数据的量的匹配的都是比较复杂的。

自然语言解析应用领域：toB toC

我讲一下我们认为在C端或者B端的应用场景，包括实体机器人虚拟助手智能家具。在B端这一块，其实有很多大家可能之前在做的NLP大家最多的2013年之前，但是这块或者金融舆情的其实在国外是一个很盛行的东西，就是说在高频交易这一块，需要金融舆情做一个深度的解析和分析，我们看到在企业信息服务、客服机器人或者产品的反馈的这种收集和检索。就像大家每天上点评和淘宝，所留下客户反馈数据，其实是非常多的。可能是说某个产品有几万条，那这个时候这几万条怎么做检索和分析？这个需要NLP的数据去做解读，这一套东西可能更偏对NLP的大数据的分析和解析，这一套在C端目前大家看到的应用场景，可能跟大家想象中的交付没有太多的关系，更多是检测控制和反馈，其实说我们需要解决的控制一套东西职能家具和虚拟助手，其实他需要解决都是一些控制问题，我在手机说虚拟助手他要控制我的APP。或者设定一个闹钟都是一个控制性的，包括智能家具，在家控制我的空调开了，开多少度，在这些都是控制性的问题，机器人未来的交互目前市面上大家解决的东西都是在控制的环节，控制的这个复杂在系统上面，而不是在NLP的深度学习上面。

a8521cabd133ccee3377cda174ab42a2d77c5a78

所以这套目来讲深度学习运用的场景在B段这块，C端在这块有很多公司号称能够提供交互的东西，但是大家玩过没有？反正我自己玩的效果比较一般。因为你只要设想一个比较复杂的场景，他基本上都难回答去完善，举例子我们在交互里面可能问一个机器人，我今天去北京，下一句我问，天气怎么样？都是直接上下文之间，今天我要去北京，他可能可以搜到今天航班和机票，我今天问天气怎么样？他不一定从上文知道我问的北京的天气，可能是上海的天气。这个对交互体验就很差了。因为时候大家交互的时候我上下文之间有很大的关联的，我问你什么时候我想看电影的时候，但我肯定问这个剧情怎么样，都是顺着来的，但很多时候做交互的人，他们想像的话题你要问的很完整，今天我要去看电影，这个电影是“星站”。“星战”的评价是怎么样？是逻辑上面的问题，我们俗称一次性的交互，这个时候是简单的，但很多时候我们人所需要的交互不会这么傻不会问，这种智能化的程度都没办法体现出来。

投资逻辑（三个方面工匠团队、技术沉淀、市场刚需）

最后讲一下投资逻辑，因为我们是投资机构，还是从投资机构的角度说，首先我们喜欢什么样的一个团队？这个仅代表个人，但也代表基金这块的喜好，我们其实更倡导的现在的技术创新比过去的模式创新，能够做创业的好时机了，现在更讲究的是技术创新的环境，我们无论从机器人还是人工智能所需要的领域，我们所喜欢的往往是工匠型的团队，因为在某个领域里面，你要轧的很深你才能知道这个领域。其实我们创业创新比你想象中的任何一步都还复杂的很多。你会发现我团队可能有问题，我的技术架构有问题，我的产品呈现有问题、我的配合的伙伴有问题，我的上游可能有问题。这种时候往往需要工匠性团队，我真的喜爱这个事情，我喜欢机器人，我喜欢人工智能，我喜欢大数据。这个时候我才能专下心里去研究，去克服他，所以障碍办法比障碍多，但障碍总会比你想象多。所以往往只有工匠性团队才能在这一块领域去做沉淀去做积累。第二个由于整个机器人或人工智能或者技术这个领域，很遗憾的我们可以看到中国和国外还是一个体系上的差异比较大，我们需要某个领域中可能说因为我们是创投机构，我们是不能够在你前期的技术研发我就陪你去投入，这个时候可能对我来讲，我们比较遗憾，我们需要你这一块有所沉淀，可能在某个点上面，某个应用领域。就像我们投的前面的机器人，我们在通用性的六关节机器人没有投，为什么我们投一个并联的？因为在这个细分领域里面，虽然市场可能一年就几十亿，但这个市场足够大。而且这个玩家在博士期间已经在研究这个领域，包括博士毕业之后，自己在公司业余时间也在做这个领域的研究。所以他有七八年的最少五年以上的技术沉淀，在工业领域最少五年以上的沉淀，才有一些技术壁垒，而不是通用性的，我们看到的目前的投资的，可能都是呈现这样的一个特制，技术上面我在某个点沉淀的特别深。

我们不太喜欢一上来说，市场很大，那现在有多少呢？不知道。如果你还没有想清楚，那我们凭什么去冒这么大的险，但除非有些时候我们也会跟团队去走，靠这个团队在某个领域或者我们现在已经看到的这个我们觉得这个领域大方向肯定有的，这个团队是我们目前找到的一个最好的团队，那我们陪你去玩我们也会做这个事情。但短期来看，我们绝大多数的项目就是细分市场型，就是说像我刚才提到的你现在说我在企业端这块我提供某个产品有刚需的或者我做教育机器的，可能说我只是做这个小孩一到三岁教育的陪伴机器人，这个时候我们会更感兴趣一些。这种都是因为市场的刚需和你的技术或者说你在这个技术也有一定的积累，你的团队本身之前就研究这个领域，这个时候我们会对这团队更感兴趣一些。所以我们最后想说还是我们基金本身，感谢创业者、投资者对我们的信任。因为无论拿我们的钱或者是给我们的钱，其实真的是对我们一种信任，因为我们接下来可能的不止是10年，你要给我的股权或者现金都是接下来我们要长期在一起，所以我们这个就是在大趋势下，一块往前走。另外我们希望把风险控制好，补充一句我们所投资过的团队，都最后给我们一个很好的反馈，也就是说我们给他们的价值超过我们给他们的现金，因为很多时候创业过程中。你会遇到你无法想象的问题，包括团队、市场、供应链、客户都会带来问题，但这个时候克服这个问题，都需要有人会跟着你走，所以为什么我们会喜欢这个就是说技术性创业和市场刚需的情况，因为这些才会使得我们还是比较偏重价值投资的。

最后感谢大家，前面讲的仅代表我的个人观点或者是机构的一些观点不代表权威的说法，因为具体到业务一线，肯定大家比我们懂，我们只能说在相对宏观的地方看的更远一点更多一点。给大家意见和想法，谢谢大家。

关于分享者：

李笙凯毕业于清华大学，拥有清华大学工学学士和工学硕士学位，现任可可资本高级副总裁，负责机器人、无人机、人工智能及智能制造方向的投资，投资项目：昂华自动化（300009-上海科创板）、思岚科技、优爱宝、济南翼菲自动化、恒正精机、玻森数据、未来机器人等。

机器人和人工智能——从现在看未来

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件