【新智元人工智能创业家】驭势吴甘沙:如何突围自动驾驶汽车?-阿里云开发者社区

开发者社区> 新智元> 正文

【新智元人工智能创业家】驭势吴甘沙:如何突围自动驾驶汽车?

简介:
创始人的初心


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy


2016 年 3 月 27 日,吴甘沙当选新智元 2016 人工智能创业家时,在新智元超智能时代论坛上发表了一番演讲,题目为:让出行成为享受。

 

“知识分子要让他去革命的话,一定要触及他的根本利益,以此推理,外企的高管要出来创业也得触及他的根本利益。去年7 月我搬到顺义,在中关村上班,于是开始了每天三个小时在上班路上的痛苦日子。所以,当有一天我的创业合作伙伴赵勇和我谈起自动驾驶时,我的内心一下子就原力觉醒了。”

 

吴甘沙是有创业梦想的。早在2001 年,吴甘沙就差点投身互联网,然而看着那浊浪滔天,他满是疑惑留在了岸上。之后吴甘沙一步步做到了英特尔中国研究院院长,而世界也变得躁动起来。云计算、物联网、大数据、互联网金融、VR/AR,一波又一波的技术浪潮,但吴甘沙始终没有选择创业。

 

2015 年英特尔一次高层领导力培训,讲师的一席话让吴甘沙彻夜难眠。

 

Leader is to design a future that 

isunpredictable and nobody bets on

领导者的使命在于设计一个不确定的未来,

没有人敢押注的未来

 

世界有时候就那么奇妙,你很难知道哪些事情会突然触动到你。但一旦发生,它就会和过去的记忆发生奇妙的化学反应。对于吴甘沙来说,内心的觉醒、真切感受到的痛点,以及智能驾驶对世界带来的巨大影响,多重因素之下,吴甘沙选择了出来创业。


新智元超智能时代论坛演讲结尾,吴甘沙深情的说:


十年以前iPhone 还没有出现,移动互联网还没有出现;五年以前iPad 刚刚出现,最近五年平板电脑差点把PC 搞死,接着又差点被大屏手机搞死,现在的颠覆速度就是这么快。

 

所以,我们真的是希望改变这个世界。

 

以前我们的世界是牛顿定律驱动的,我们用多大的力,就能够产出多少收益,我有多少钱就做多少钱的事,过去做什么,会什么,决定了未来能做什么。

 

但是现在王飞跃老师(中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任)告诉我们这是默顿定律的时代。

 

首先你要看到一个未来,要有一个坚定的信念,这个信念会对你现在的行为产生一种引力,预言你会自我实现。

 

只要你有这样一个信念和梦想,你就能获得聪明的钱的支持,你就能够获得人才,你就能够跟更多的小伙伴们一起合作,你就能够让预言自我实现。


注:这次演讲标题为:让出行成为享受。演讲本身没有谈技术。

  

合伙人阵容

 

 “他的团队少见地吸纳了许多超级天才”,李开复评价说:“其中有来自大学的机器专家、顶尖的计算机视觉专家以及来自Google 的机器学习团队,还有吴甘沙自己和他领导的半导体专家团队。吴甘沙是一名优秀的领导,他能把这些人都汇集到一起来。”

 

驭势的核心人物除了吴甘沙之外,还有赵勇、姜岩、彭进展、周鑫。

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

从左至右为彭进展,吴甘沙,周鑫,姜岩和赵勇。图:纽约时报

 

赵勇是格灵深瞳的联合创始人,14年开始研究汽车视觉,在车用双目立体摄像头、基于深度学习的汽车视觉算法上有了极其深厚的积累。赵勇将代表格灵深瞳作为驭势董事发挥重大价值,并确保驭势始终拥有业界领先的无人驾驶视觉解决方案。

 

姜岩是2013 年智能车未来挑战赛的冠军,这几年潜心专研低成本感知配置、无需高精度地图的自动驾驶,已经在各种路况下实现了1 万多公里的技术验证。

 

彭进展曾是英特尔研究院机器人系统实验室的总监,从事SLAM 和低成本、实时芯片设计的前沿研究。在这之前,他是英特尔屡获殊荣的Edison 芯片的主要系统架构师(在2014 年CES 获得了4 个奖项)。他拥有超过14 年的软件系统和软硬件协同设计的经验。

 

周鑫曾是英特尔研究院数据经济实验室研究总监,他创造了可信多方数据交换和分析平台。他有非常多元化的背景,是早期Larrabee 团队的一员(Larrabee现在变成了至强融核协处理器,被全球排名前列的数百台超级电脑使用),他也是英特尔并行编程解决方案技术的领导者之一。他在2008 年演示了英特尔首款ADAS 技术方案。

 

包括吴甘沙在内的原英特尔团队擅长高性能计算和嵌入式芯片设计,将致力于设计每秒数万亿次浮点运算的高性能、高可靠、高安全车载电脑,因为视觉感知、多传感器融合、自动驾驶控制和规划需要巨大的计算量。


不惧巨头,偏向虎山行


驭势科技偏向虎山行的背后,源于核心团队对产业的深度了解。

 

虽然对手十分强大,但吴甘沙认为这不是通往智能驾驶目标的最好路径。吴甘沙举了两方面的的例子,分别从Google 和百度的高举高打的方式、Mobileye的ADAS 进行解释。

 

Google 和百度:太贵了

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy谷歌无人驾驶汽车,注意看车顶,简直贵哭了~~~

 

Google 和百度在智能驾驶的发展路径,基本是高举高打:三大件,激光雷达70 万元,高精度GPS 和高精度激光陀螺(或光纤陀螺)也需要几十万。三大件可以给智能车带来更好感知能力,但不适合中国。

 

在三大件的基础上做出来的智能车,一辆车大概200 万人民币。而现在一个司机的成本每年只有6、7万,在经济账上并不划算。这意味着200 万元的智能车,在中国不一定能找到很好的商业模式和应用场景。

 

机械部件和激光部件成本下降也比较慢,像Google 用的Velodyne 64 线激光雷达既是机械又是激光的,所以不能期望它在未来几年明显降低成本。虽然现在Google 在去年下半年开始自己招人做激光雷达,但是产业的核心逻辑,并不会改变。


Mobileye:艰难变革

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy


Mobileye 是全球ADAS 技术路线的领导者,但是驾驶辅助并不会自然进化为智能驾驶。

 

这背后的根本原因,是因为ADAS 是以人驾驶为主,机器辅助,所以它会做出离散的警示,例如车道线偏离了给一个警告,但这个检测算法到底是70% 还是80%,可能还不如误报率更受关注,毕竟真正的复杂决策和控制是人来做的。


gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

 

而智能驾驶常常是以机器驾驶为主,人驾驶为辅,它要求算法连续、准确、可靠地输出,而且绝对不能够为了减少误报而牺牲精度。

 

传统的ADAS 成本非常重要,要想获得市场,往往得做到100 美元以下。但这种硬件成本是跑不了深度学习的,所以很多算法和技术都没法展开。


而智能驾驶对成本没有那么敏感,性能和准确性是最重要的。所以智能驾驶可能价格高一些,但能够采用深度学习的方案。

 

Mobileye 要从ADAS 过渡到自动驾驶,必须对硬件体系、软件算法进行大改,这时候传统的优势就可能变成劣势。虽然从种种报道看它也在转向深度学习,但其旗舰芯片eyeQ留给深度神经网络的面积不到5%。最近有一条新闻,特斯拉聘用了前AMD 的架构师做工程副总裁,可能意味着特斯拉也在寻求除了Mobileye之外的高性能计算解决方案。

 

计算的信仰者:低成本感知+高性能计算


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy


驭势科技核心团队多出自英特尔,而英特尔是芯片产业的领头羊。1971年,英特尔联合创始人Gordon Moore 提出了著名的摩尔定律,内容是:当价格不变时,集成电路上可容纳的元器件数量约每隔18-24 个月就会增加一倍,性能也将提升一倍。

 

计算能力在过去的几十年里呈现飞速的提升。单颗芯片上的晶体管数目,从1971 年到1997 年,26年增长了3200 倍;从1997 年到2013 年,16年的时间增长186 倍。在英特尔潜心工作了16 年的吴甘沙,显然深深受到了英特尔的影响,有一种发自内心对计算的信仰。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

 

所以也无怪乎驭势科技选择了和行业巨头不同的发展路径:低成本感知+高性能计算。吴甘沙认为:

 

“我们的自动驾驶策略有一个简单的假设,每一个传感器都是不可靠、不精确的。GPS、惯导、双目测深度和视觉算法都有误差,但几个融合起来能否做到稳定可靠的横向和纵向10 厘米定位,是我们要考虑的。”

 

对于Google 来说,他们用2.0 的视力做无人驾驶,而对于驭势科技来说,他们考虑1.0 的视力,加上强大的计算能力,做多数情况下的自动驾驶。这意味着500 美元的低感知成本,1000 到2000 美元的计算成本。当然,计算架构不能只考虑快,还需要足够的冗余,不仅是同构的冗余,还有异构的冗余;不仅有GPU 和FPGA,还有嵌入式的视觉芯片;不仅有深度学习,还有非深度学习。这样才能保证足够可靠。

 

吴甘沙相信,计算的发展速度会远快于机械的发展速度,未来计算性能的提升和成本下降会非常快。

 

基本产品架构


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

 

驭势科技自动驾驶技术负责人姜岩对未来要发布的产品做了简单的说明:我们希望以低成本实现自动驾驶或无人驾驶的产业化。在汽车产业这一专业性极强的产业中,我们不会去做专业公司已经在做的事情。

 

硬件:我们不会做汽车,只会提供解决方案;解决方案中的核心载体是自我研发的车载超级电脑,这台超级电脑负责解决自动驾驶中感知、定位、规划和控制的所有工作。

 

传感器:如果有现有传感器能够满足我们的要求,我们会尽可能的采用货架产品,比如毫米波雷达,超声波雷达,以及低成本的GPS。

 

机器视觉:由于现在还没有能够满足我们要求的货架产品,因此我们会推出自己的机器视觉解决方案。这也是我们的优势之一。

 

目前Mobileye 并不提供立体视觉系统,同样视觉地图定位功能也才刚刚开始,这两个功能是我们视觉系统的核心。


加法策略


驭势科技的产品方案是,从最低成本的传感器开始,以视觉、雷达和商业化的GPS、惯导为主要手段,然后慢慢的做加法。

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

驭势将采用的低成本视觉技术方案,注:该车为格灵深瞳实验用车。图:格灵深瞳

 

双目摄像头+深度学习

 

双目摄像头在智能驾驶的场景用的并不多,现在主流车型中只有斯巴鲁的一款车用了日立的双目。双目做起来非常不容易,首先在结构设计上,要保证在风吹日晒下保证形变最小,而有了微形变要能做自我校准;

 

其次是双目的算法要做到低误差和实时性。如今驭势科技已经解决了这两个方面,研发的双目摄像头最远能看到160 米,在10 米左右误差能达到几厘米,高清,30帧每秒。

 

当解决了双目的问题,它的好处就显示出来。吴甘沙展示了一个路面场景,即便不使用深度学习,也可以对路面的车辆和障碍物形成双目深度信息:高速移动的点云判断是车,不动的密集点云是路边的障碍物。虽然驭势团队的深度学习算法能做到,只要车体露出30%即能检测,但是旁边车道车只露出一点点的时候是最危险的,这就得使用不依赖于深度学习的双目摄像头了。

 

所以这个双目可以形成非常廉价的视觉雷达方案。


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

 

驭势还展示了一个纯视觉的车机解决方案,除了传统的车道线检测、道路目标的检测之外,也展示了非常精确的深度判断。虽然说很多单目方案号称可以用Structure from Motion 的算法实现立体视觉,但往往只适用于AEB 紧急刹车、FCW防碰撞,对于高精度的视觉定位准确度是达不到的。

 

低成本视觉的灵活性

 

基于低成本的视觉算法,会让整个智能驾驶产品变得更加灵活,这也是驭势坚持的加法策略。加法的理念是,当DGPS/RTK 比较便宜以后,或者在特定的环境做无人驾驶DGPS/RTK 的成本可以接受,那么就把它加进去。

 

同样,激光雷达足够便宜和成熟的时候,也可以加进去,驭势现在也做激光雷达的布局。

 

另外一块就是地图,现在驭势基于视觉已经有了一个很好的地图建构和视觉定位的解决方案,未来希望通过众包的方式,把更广区域的地图建立起来。

 

其他关键策略


小型化、高性能、高可靠的硬件架构

 

要做到小型化、高性能、高可靠的硬件架构,为了实现这个不能牺牲成本。系统必须引入足够的计算力,保证算法最优化运行,也要采用符合车规的部件,引入足够的冗余,保证高温度范围、防尘防震。这方面从英特尔出来的工程师很有经验。

 

在线机器学习

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy


达到 99.999% 是一个很难的目标。基于统计的机器学习,包括深度学习无法穷尽样本空间,都意味着无法保证100%。所以只能通过更多的数据去驱动,甚至需要在线机器学习,这是逼近99.999% 的一条途径。

 

多传感器融合


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

 

相比一个视觉传感器,必须采用多传感器融合的方法。传统的ADAS 视觉方案只解决了防撞、车道线的功能,但是真正的自动驾驶需要多种传感器融合,包括雷达,GPS,IMU,甚至未来需要激光雷达和V2X。

 

地图+定位


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

 

除此之外还要解决地图建构和定位的问题。Google在做高精度地图,HERE、TomTom 和国内的四维图新也在做。但究竟怎样的地图是自动驾驶需要的,现在还没有定论。目前来说,高精度地图实际上是一种束缚,因为大部分的区域,其实都是没有高精度地图的。所以我们采用了更加实用的方式,解决自动驾驶定位和地图构建的问题。

 

规划和控制


gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

 

做完定位和地图还不够,还要解决规划和控制的问题。控制必须是实时的,大概几十毫秒级;决策是秒级的,规划大概是10 秒级。我们有两个基本基本假设:

 

1、我们各个传感器过来的数据不一定是可靠的;

2、所有的传感器可能都失效。

 

在这样的场景下车怎么办?就需要机器学习的方法了,采用深度学习、增强学习来解决规划的问题。目前来说,在控制中增强学习是更现实的,AlphaGo正是使用这个技术完成实现自我对弈、形成估值网络的过程。

 

高可靠性


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

 

要实现高可靠性,系统软件架构非常重要。软件必须按照流程,模块级别要有压力测试,也要有方案的集成测试,大量地去路测。

 

另外状态监控也非常重要,要在车里放进去一个类似飞机的黑匣子,这样未来自动驾驶出问题的时候,要能够发现是谁的问题,厘清是谁的责任。

 

高安全性

 

开放的操作系统,只要联网就有可能遇到Car Hacking。所以需要一套新的安全设计方法论。

 

1.规范是正确的,dothe right system

2.实现是准确的,dothe system right

3.运行时怎么保证系统是足够安全的,黑客不能侵入

4.一旦出问题以后,要有好的方式马上取得控制

 

中美需求的差异

 

中国和美国在功能选择上有一些差异。在一次对美国特斯拉车主的调研中,他们对于高速ACC、车道保持的功能非常愿意使用。而对于中国来说,在北京这种地方总是开开停停,所以交通堵塞辅助的功能就非常有用。另外停车场的无人驾驶功能也非常好,例如去新光天地到地下停车场,往往需要花10 多分钟找停车位。其实可以让它自己找地方停,需要的时候一键召回就好了。

 

保守和竞争的策略

 

智能车的驾驶,太过保守的话可能总是被人加塞,无法获得路权。Google最近试图调整驾驶策略,从以安全为第一目的,慢慢的加入人的竞争因素,结果就撞上大巴了。所以这需要一个发展的过程,在中国尤其要多考虑自动驾驶策略,既能够保证安全,又可以获得路权。


两大价值主张:5 到10 年规划

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy


吴甘沙给智能车的发展划分了两个阶段,分别是5 年为限,以及5 到10 年。两个不同的阶段,价值主张是不同的。

 

0 到 5 年:主要服务驾驶员

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy


在这个阶段,智能车发展的价值主张是服务好驾驶员,给他们带来额外的安全和舒适。

 

这个阶段一开始是主动安全,慢慢加入半自动驾驶,多种功能融合的形态,在通向第四级全自动驾驶的过程当中慢慢逼近高度自动驾驶。高度自动驾驶中人完全放手,驭势认为驾驶员对机器建立信任需要时间,所以在二级和三级自动驾驶中间引入了增强驾驶。这是一种人机共驾的体验,人在开的时候,机器也在开,机器不断学习人的行为,改进自己的算法,并且给驾驶员能够带来更多的安全和舒适。

 

驭势也非常看好限定场景下的无人驾驶,可能是在私有的园区、专用的道路、固定的线路、中低速环境下行驶,甚至可以在路上刷特殊的标志,针对区域加专门的差分基站,或者在红绿灯上面装射频装置,跟车进行联系。

 

这种方向和前面的辅助驾驶、增强驾驶是可以融合的。比如说现在做分时租赁,主体是辅助驾驶,但它的一个痛点是取车和还车要花很多的时间。如果车在停车场的范围内实现无人驾驶,就能很好的解决问题。

 

所以这些都会在五年内发生。

 

5 到 10 年:主要服务出行者

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy


在这个时间内,技术会逐渐从以驾驶员为中心,演进到以出行者为中心。这时候的价值主张,就变成了如何给出行者提供更便捷、更廉价的工具和服务,让他们把出行时间转化为生产力。这时候无人驾驶会获得更大的发展,例如早期可能在最后五公里实现无人驾驶,在家和地铁站之间会有很多这样的小车完成接送工作。慢慢地城市区域的无人驾驶将进入规模商用。这样的无人驾驶汽车,会成为家和办公室之间的第三空间,它是移动的商业地产。

 

城区的无人驾驶实现以后,下一步是实现全天候、全区域的无人驾驶,这个确实可能需要很长的时间。但一旦针对人的无人驾驶实现了,那么整个人、物交通的产业链都会被重新定义:包括物流、停车、保险和服务业等。


成为驭势合伙人,只要您是五有青年


帮转。

 

首先声明,这里“青年”指的是心智达到成年人且没有“童工”之嫌,心态足够年轻不论岁数多大都行。

 

哪五有呢?

 

有种:速度,激情,责任,抱负

有趣:乐观,幽默,有爱好,向往美好

有料:一般认知,表达,专业,工程,学习能力

有情有义:参考《教父》和《纵横四海》

 

很多有才华的人,坐在庞大的车上不起眼的位置,有的固然有个驾驶员的位置,一脚油门踩下去,整个车肉到没有反应。有一天,当你不想起床上班时,不再有多年前第一天工作的那种激情时,你应该寻求改变。

文章转载自新智元公众号 原文链接

版权声明:如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developerteam@list.alibaba-inc.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
+ 订阅

官方博客
官网链接