从特斯拉 AI 团队学到的九条方法论
尽管 OpenAI 以其在自然语言处理上的成就而著称,而 DeepMind 则以强化学习和决策而闻名,特斯拉(Tesla)无疑是计算机视觉领域最有影响力的公司之一。即便你不是计算机视觉专业人士,你也可以通过特斯拉了解到不少它的生产级人工智能。特斯拉的人工智能团队并没有像 Uber 或 Airbnb 那样发表博文,因此外界很难了解他们都做了什么,又是怎样取得今天的成绩。不过,特斯拉在 2021 年举办的“人工智能日”展示了许多技术和经验,这些技术和经验对所有的人工智能部门和企业都有借鉴意义。下面是一些经验。商业创新(再)运用尖端科技特斯拉公布了其最新产品:特斯拉机器人(Tesla Bot),这是一款人形机器人产品。尽管汽车和机器人看上去差别很大,但是无人驾驶汽车和由人工智能控制的机器人实际上有许多相同的部件。举例来说,特斯拉汽车和特斯拉机器人都需要传感器、电池、实时计算和分析接收到的数据,同时还需要即时作出决策。所以,特斯拉开发的人工智能芯片和硬件都可以在两者中使用。特斯拉的两款产品在软件和算法上都要求有一个视觉系统和规划系统。所以特斯拉汽车团队能够和特斯拉机器人团队共享软件代码库。规模经济将会进一步降低平均开发费用,从而使得特斯拉在市场上更加具有竞争力。特斯拉的人工智能团队还有一个优势,那就是特斯拉机器人所收集到的数据也可以用来训练特斯拉的无人驾驶汽车。事实上,还有其他重用内部先进技术的例子。其中之一就是 reCAPTCHA。Luis von Ahn 最先联合发明了验证码(CAPTCHA),它要求用户输入屏幕上显示的字母,从而实现自我认证。之后,他开始向自己挑战,让验证码变得更加有用,最终,他和《纽约时报》(NY Times)共同发明了 reCAPTCHA,这个系统能将书籍中的长句分解,要求用户输入他们所看到的内容。只需稍加修改,就可以让 几百万本书在数天之内被数字化,而这一过程原本很可能需要花费好几年才能做到。如果你的公司拥有独一无二的技术,那么请记住技术的本质,并且考虑哪些人可以从你的技术中获益。把你的思想资源用在这上面,你就能找到下一个业务线了。改进与进步迭代进步在问答环节中,伊隆·马斯克(Elon Musk)说:一般来说,创新就是很多次迭代,每次迭代之间的平均进程。所以,在迭代之间缩短了时间,那么改进的速度将会好很多。因此,如果一个模型的训练时间有时需要几天,而不是几个小时,那就太重要了。这已经解释了为什么特斯拉拥有一支 工具团队,并在内部制造了很多东西。而这就是下一个经验。专门设计的系统优于一般的系统特斯拉知道 GPU 一般都是内置的硬件,而用专门设计的芯片进行大规模计算,速度会更快。正因为如此,特斯拉才有了自己的人工智能芯片:Dojo。除芯片外,特斯拉还建立了自己的人工智能计算基础设施,每周进行 100 万次实验。他们还构建了自己的调试工具,可以把结果可视化。在演讲中,Andrej Karpathy 提到,他发现数据标签管理工具很关键,他们为这个工具感到自豪。如果你的团队没有足够的资源来构建自己的工具,那么你可以加入开源社区。你可以根据自己的需求,创建一个基于开源项目的东西。如果你遇到了新问题,或是有了更好的点子,那么就开始开发最初的原型,并写好文档的困难部分,这样才能让与你有类似问题的人能够帮到你。错误在所难免,从中汲取教训如果你稍微了解一下舞台上那些人的背景,你就会发现他们都是非常聪明的人,他们都是拥有博士学位、从顶尖大学毕业的人,或是曾经干过什么了不起的大事。这些人也有失误的时候。Andrej Karpathy 分享说,他们最初是和第三方的数据提供商一起工作的。我想,他们之所以这么做,是为了更快速地获取数据,降低成本。但是,他们不久就会意识到,在这样的关键问题上,与第三方合作,和来回的沟通,并不能解决问题。因此,他们把注释员引进公司,目前已有超过 1000 名注释员。从这一经验教训中我们可以学到,创新和技术进步都是一个不断试错的过程。错误就是它的一部分。如果你逃避错误,把失败归咎于他人,那么你就没有学习到什么,也不会取得进步。人工智能实践**神经网络是一块“乐高积木”**在问答分享中,Ashok Elluswamy 提出,神经网络仅仅是系统中的一块,可以与任何东西结合。他解释说,实际可以将搜索与优化融入到网络架构中,也可以将基于物理学的块(模型)和神经网络块相结合,形成一个混合系统。我觉得 把神经网络和非神经网络模型结合在一起进行训练,这个主意很有意思,而且非常值得一试。HydraNetsHydraNet 的想法可以追溯到 2018 年,这在人工智能社区中已经存在很久了。尽管如此,我仍然觉得这个主意不错,而且在许多情况下会非常有用。Andrej 解释说,HydraNet 允许神经网络 共享一个共同的架构,将任务解耦,你可以 为中间的特征缓存,从而节约计算。模拟作为解决数据不足的一种方法标签不平衡是一种常见的、无所不在的现象。少数族裔的数据即使不是不可能,也很难获得。但是,要在现实世界中部署人工智能,最关键的问题总是在边缘的情况下,因为这会带来严重的、不必要的后果。模拟是一种用于生成新数据的数据论证技术,但是说起来简单,实际操作起来却很困难。在特斯拉,模拟团队采用了诸如光线追踪之类的技术,以产生逼真的视频数据,我个人乍一看无法判断这些数据的真伪。我想,这项技术的确是特斯拉的一件秘密武器,因为它可以轻易地获取到许多非同一般的数据。如今,他们能够生成像一对夫妻和一条狗在高速公路上狂奔的视频数据,这虽然是不太可能的事,但绝对有可能生成。对了,你怎么看到“模拟即服务”这个想法?99.9% 的时间你不需要机器学习曾有观众问,特斯拉是否将机器学习用于其制造设计或其他工程流程,马斯克是这样回答的:对于 99.9% 的数据,我不做任何评论,这要看你说的是什么。举个例子,你不一定要用机器学习,才能找到你最大的消费客户。你所需要的仅仅是一种排序算法。不过,我发现很多人都会犯这个错误。为了让机器学习有效,你必须满足一系列的条件。即使不能,也有很多可以帮你解决数据科学问题的 工具。比如,遗传算法、数学建模、调度算法,等等。如果你有一把锤子,所有东西看起来都像钉子。数据和计算无人驾驶模拟团队的经理 Ian Glow 提到,最近有一篇关于现实增强(photorealism enhancement)的论文,展示了最新的研究成果,但是他的研究团队可以做到的远多于那些已经发表文章的团队。原因在于特斯拉的数据、计算能力和人力都要多。这仅仅是深度学习中的数据和计算至关重要的又一例证。我想这个经验就是,如果你真的想要将深度学习应用到生产中,那么就应该花些时间来思考一下,怎样才能得到数据,并且能够更有效、高效地利用计算能力。继续这样做,直至你使获取数据和使用数据的平均成本可以忽略不计。结语虽然很多人专注于深度学习模型的实施细节,但是我相信,大的想法、教训和背后的思考过程同样有价值。我希望这篇文章能为你提供一些新的知识,并有助于你发展更好的机器学习实践。作者介绍:Gary Chan,数据科学家。原文链接:https://pub.towardsai.net/9-lessons-from-the-tesla-ai-team-3c311100e6cc
CVPR2021 | 开放世界的目标检测
前言:人类具有识别环境中未知对象实例的本能。当相应的知识最终可用时,对这些未知实例的内在好奇心有助于了解它们。 这促使我们提出一个新的计算机视觉问题,称为:“开放世界对象检测”,其中模型的任务是:1)将尚未引入的对象识别为“未知”,无需明确监;2)在逐渐接收到相应的标签时,逐步学习这些已识别的未知类别,而不会忘记先前学习的类别。我们制定了这个问题,引入了评估协议并提供了一种新颖的解决方案,我们称之为 ORE:开放世界对象检测器,基于对比聚类和基于能量的未知对象识别。我们的实验评估和消融研究分析了 ORE 在实现开放世界目标方面的功效。作为一个有趣的副产品,我们发现识别和表征未知实例有助于减少增量心理对象检测设置中的混乱,在那里我们实现了SOTA性能,而无需额外的方法论。我们希望我们的工作能够吸引对这个新确定但至关重要的研究方向的进一步研究。本文出发点深度学习加速了目标检测研究的进展,其中模型的任务是识别和定位图像中的对象。 所有现有的方法都在一个强有力的假设下工作,即所有要检测的类在训练阶段都可用。当我们放宽这个假设时会出现两个具有挑战性的场景:1)测试图像可能包含来自未知类的对象,这些对象应该被归类为未知。2)当有关此类已识别未知数的信息(标签)可用时,模型应该能够逐步学习新类。发展心理学研究发现识别未知事物的能力是吸引好奇心的关键。这种好奇心激发了学习新事物的欲望。 这促使我们提出一个新问题,即模型应该能够将未知对象的实例识别为未知对象,然后在训练数据逐渐到达时以统一的方式学习识别它们。 我们将此问题设置称为开放世界对象检测。开放世界对象检测设置比现有的封闭世界、静态学习设置更自然。 世界在新类的数量、类型和配置方面是多样化和动态的。 我们不能假设在训练期间可以看到推理时期望的所有类。 检测系统在机器人、自动驾驶汽车、植物表型分析、医疗保健和监控中的实际部署无法在内部训练的情况下全面了解推理时预期的类别。人们可以从部署在这种设置中的对象检测算法中期望的最自然和现实的行为是自信地将未知对象预测为未知,并将已知对象归入相应的类。 当有关已识别未知类的更多信息可用时,系统应该能够将它们合并到其现有的知识库中。 这将定义一个智能对象检测系统,我们正在努力实现这一目标。计算机视觉任务难度图 本文贡献• 我们引入了一种新颖的问题设置,即开放世界对象检测,它更接近地模拟现实世界。• 我们开发了一种称为 ORE 的新方法,它基于对比聚类、未知感知提议网络和基于能量的未知识别,以应对开放世界检测的挑战。• 我们引入了一个全面的实验设置,它有助于测量对象检测器的开放世界特征,并根据竞争基线方法对其进行基准测试。• 作为一个有趣的副产品,所提出的方法在增量对象检测方面实现了最先进的性能,即使主要不是为此而设计的。Open World Object Detection开放世界对象检测设置考虑了一个对象检测模型 Mc,该模型经过训练可以检测所有以前遇到的 C 个对象类。 重要的是,模型 MC 能够识别属于任何已知 C 类的测试实例,并且还可以通过将其分类为未知类实例来识别新的或未见过的类实例,用标签(0) 表示。然后人类将未知的实例集 Ut识别 n 个新的感兴趣类(在潜在的大量未知数中)并给模型提供训练示例。学习器逐步添加 n 个新类并自行更新以生成更新的模型 MC+n,而无需在整个数据集上从头开始重新训练。已知类集也更新 Kt+1 = Kt + {C + 1, ... . . ,C+n}。这个循环在物体检测器的整个生命周期中持续,在那里它用新知识自适应地更新自己。 ORE(开放世界目标检测器)一种成功的开放世界对象检测方法应该能够在没有明确监督的情况下识别未知实例,并且在将这些识别出的新实例的标签呈现给模型以进行知识升级(无需从头开始重新训练)时,不会忘记早期实例。 我们提出了一个解决方案 ORE,它以统一的方式解决了这两个挑战。设计思路如下:神经网络是通用函数逼近器,它通过一系列隐藏层学习输入和输出之间的映射。在这些隐藏层中学习的潜在表示直接控制每个功能的实现方式。 我们假设在对象检测器的潜在空间中学习明确区分类别可能会产生双重影响。首先,它帮助模型识别未知实例的特征表示与其他已知实例有何不同,这有助于将未知实例识别为新颖性。 其次,它有助于学习新类实例的特征表示,而不会与潜在空间中的先前类重叠,这有助于在不遗忘的情况下进行增量学习。帮助我们意识到这一点的关键部分是我们在潜在空间中提出的对比聚类。为了使用对比聚类对未知数进行最佳聚类,我们需要对未知实例进行监督。 即使是潜在的无限未知类集的一小部分,手动注释也是不可行的。 为了解决这个问题,我们提出了一种基于区域提议网络(RPN) 的自动标记机制来伪标记未知实例。 潜在空间中自动标记的未知实例的固有分离有助于我们基于能量的分类头区分已知和未知实例。如上图所示,选择 Faster R-CNN 作为基础检测器。与单阶段的Retina Net 检测器和YOLO 检测器相比,它具有更好的开放集性能。Faster R-CNN是一个两阶段的目标检测器。在第一阶段,一个与类别无关的区域提议网络 (RPN) 从共享骨干网络的特征图中提出可能具有对象的潜在区域。第二阶段对每个提议区域的边界框坐标进行分类和调整。由感兴趣区域 (RoI) 头部中的残差块生成的特征进行对比聚类。RPN 和分类头分别用于自动标记和识别未知数。对比聚类算法如下: Auto-labelling Unknowns with RPN我们基于区域提议网络 (RPN) 与类别无关的事实。给定输入图像,RPN 为前景和背景实例生成一组边界框预测,以及相应的对象分数。我们将那些具有高对象分数但不与真实对象重叠的提议标记为潜在的未知对象。简单地说,我们选择前 k 个背景区域提议,按其对象性分数排序,作为未知对象。Energy Based Unknown Identififier由于通过对比聚类在潜在空间中实施了清晰的分离,可以看到已知类数据点和未知数据点的能级明显分离,如上图所示。我们通过energy based models(EBMs)来学习一个能量函数,使用单个输出标量来估计观察变量 F 和可能的输出变量集 L 之间的兼容性。Alleviating Forgetting我们考虑了终身学习中的很多方法,最终决定使用相对简单的 ORE 方法来减轻遗忘,即我们存储一组平衡的示例并在每个增量步骤之后微调模型。在每一点上,我们确保每个类的最少 Nex 实例存在于示例集中。 评协议实验结果蓝色部分为刚开始作为背景,在经过ORE训练后自主识别的准确度。该图展示了ORE通过RPN很好地识别了一些未知对象,但在第三张图中也有指鹿为马的现象出现。
破壁人AI百度:科技公司反内卷的典型样本
破壁人AI百度:科技公司反内卷的典型样本互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。 互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
AI老司机,驾龄等于人类2万年:计划两年登上百万台车
毫末智行的 HPilot,不到一年时间就站上了国内智能驾驶第一。自动驾驶前进的速度,比我们想象得要快一些:今年,全场景辅助驾驶就会在国内落地了。4 月 19 日,毫末智行在 AI DAY 活动正式推出「城市智慧领航辅助驾驶系统」NOH,并预计将于年中量产落地。「2021 年,毫末智行提出中国自动驾驶的新范式,也就是毫末智行的致胜公式:以领先的数据智能体系,乘以稳定的量产能力乘以安全,之后再乘上生态的 N 次方。毫末智行的致胜公式源于毫末对自动驾驶行业的深刻理解,是毫末智行自动驾驶技术产业化落地的重要举措,」毫末智行董事长张凯在活动中说道。随着技术的发展,高级别智能驾驶正处在大规模量产的前夜。为毫末所有智能驾驶产品提供技术动力支撑的自研数据智能体系 MANA 正发挥出巨大优势。智能驾驶领域里,毫末智行已经进入领先者队列,这家公司刚刚公布了最新辅助驾驶总里程记录:已突破 700 万公里,用户使用总时长超过 13 万小时。在毫末产品规模量产的进展上,去年 3 月,毫末智行在品牌开放日活动中展示了 HPilot 1.0 系统,5 月实现量产落地。截止今年 4 月,HPilot 已登陆魏牌摩卡、坦克 300 城市版、魏牌玛奇朵 DHT、魏牌拿铁 DHT、哈弗神兽、坦克 500 六款车型,成为国内应用量最多的自动驾驶系统。「最近一年,自动驾驶的基础技术发生了很多变化,车载芯片算力不断提升,Transformer 跨模态模型获得应用,摄像头清晰度增加。在感知技术进化的前提下,辅助驾驶实现的方法也在发生改变,」毫末智行 CEO 顾维灏说道。在城市辅助驾驶任务上,MANA 从感知到认知层面的能力都有了大幅度升级。MANA 进化:学会看红绿灯,多模态 Transformer从高速路到城市辅助驾驶,路况的复杂程度成倍增长,让汽车学会如何看红绿灯并识别对应的车道线就是重要的挑战之一。从 AI 技术的角度看,这就是一个小目标检测问题:交通灯的状态会动态变化,又具有明显地方特色,横着的、竖着的、三个的、五个的、有待转的、有倒计时的,形色各异。智能驾驶系统必须区分每个灯具体指示哪条线路。毫末给出的解决方法是通过图像合成和迁移学习加快技术的迭代,其中主要的挑战是实现真实数据和合成数据的混合训练。通过图像合成技术,毫末的工程师扩大了机器学习的样本量,弥补了真实场景数据样本不均衡的问题。在不完全依赖高精地图的情况下,若想成功实现红绿灯识别,需要完成灯型和状态的检测,同时也要完成在视野中多组红绿灯中识别目标灯组的绑路操作。毫末智行设计了一个针对红绿灯检测及绑路的「双流」感知模型,将红绿灯检测和绑路问题分解成两个通道。据毫末介绍,这种技术类似于人脑的视觉感知通道,其中 ventral stream 主要携带物体检测及识别信息,主要负责识别通路(what),dorsal stream 主要携带视野中位置及空间关系的信息,主要负责寻找路线(where)。在双流模型中,ventral 通路主要负责红绿灯的识别信息,包含对红绿灯灯箱的检测和灯型的分类,分别输出红绿灯的颜色、形状和朝向信息。Dorsal 通路主要负责红绿灯绑路,输出目标车道的红绿灯灯组,其通过训练生成特征图,获得真实图像中经常出现红绿灯位置的位置概率。随后,模型利用空间注意力机制将二者结合起来,双流模型将输出绑路后的目标车道红绿灯通行状态。训练完成后,毫末智行对这些模型进行了大量测试,在不同城市、不同距离、不同转向目标、不同光线的条件下均实现了准确的效果。Transformer 架构是当前人工智能领域最热门的技术。过去一年里,视觉 Transformer(ViT)已经成为视觉识别的强大支柱。由于性能强大,其在自动驾驶的各独立传感器中都获得了应用。人们发现,Transformer 结构可为自动驾驶带来几种优势:更高效地利用模型体量和数据,通过注意力结构融合多模态数据,减少对于标注数据的依赖。在多传感器融合的尝试中,交叉注意力机制(Cross Attention)被用来作为多模态数据的融合工具,大量减少了人工先验的介入,可以让基于优化的端到端算法和数据驱动更方便的结合,进一步发挥 Transformer 架构的潜力。毫末智行根据智能驾驶任务的特点提出了自己的 BEV Transfomer,利用注意力机制解决了多相机视角拼接问题,在车道线识别任务上取得了进步。具体来说,新系统在得到摄像头数据后,首先对 2D 图像用 Resnet + FPN 进行处理,之后进行 BEV Mapping,利用 Cross Attention 来动态的确定某一帧图像中的内容在相机所属 BEV 空间中的位置。通过多个 Cross Attention,最终组成一个完整的 BEV 空间。当视觉特征完成 BEV 投射之后,就天然具备了和 LiDAR 模型的融合能力。最后,算法又通过 History BEV 加入与时间有关的特征,进一步提升识别的准确率和连续性。在自动驾驶中应用 Transformer 可谓最前沿的尝试,获得的回报也非常可观。特斯拉 AI 总监 Andrej Karpathy 曾介绍了特斯拉 FSD 基于 Transformer 的 BEV 网络结构,由于 BEV 空间下的感知结果与决策规划所在的坐标系是统一的,因此感知与后续模块通过 BEV 变换可以紧密联系到一起。此外,BEV 方法可以有效融合多传感器的输出,让近处大目标尺寸估计和追踪都变得更加准确。该方法的使用确立了 FSD 在视觉感知的领先地位。那毫末 BEV Transfomer 的实现效果如何呢?毫末表示新的方法对自车姿态的容忍度更高,在复杂路面纵向误差表现更好,对于路面起伏的鲁棒性更高。另外,利用多相机输出内容相互辅助,扩充了检测视野,自动驾驶对周围事物的响应也更快。目前在业内,只有毫末智行和特斯拉在自动驾驶视觉上大规模应用了 Transformer 架构。此类感知算法在稳定成熟后,将逐步替换基于 CNN 的感知算法。用大模型实现自动驾驶「认知」能力城市自动驾驶面临的复杂问题往往超过感知层面。在更高层次的认知问题上,毫末智行也有一些新成果。比如非常微妙的路口博弈场景的左转待转时,辅助驾驶车辆需要等待前方掉头车,还需观察避让对向直行车辆、与对向右转车交互。处理这样的场景,过去自动驾驶算法需要写非常多的规则式场景判定和参数,代码难以调试。当规则越来越多的时候,就会引发逻辑爆炸,导致规则失效。毫末则使用机器学习模型来替换手写规则和参数,获得更广泛的适用性。毫末提出的 TarsGo 模型目前可以处理很多复杂的辅助驾驶场景,如环岛、辅路汇入、压速变道等等。去年,阿里提出了 10 万亿参数超大规模中文预训练模型 M6,成为国内首个实现商业化落地的多模态大模型。毫末智行和阿里达摩院进行了合作,使用 M6 对自动驾驶数据进行图像可解释性标注,获得了前所未有的效果。通过注意力机制,AI 模型可以用热力图方式量化出与周围交通参与者的安全风险,近距离用红色表示,输出 Attention High,而中距离用黄色表示,输出 Attention Middle。M6 在自动驾驶领域的应用体现了 AI 能力的普惠化 —— 以往被其他行业使用的数据,现在也可以迭代提升自动驾驶能力了。毫末智行还与阿里合作,基于 128 卡 A100 集群,实现了 Swin Transformer 模型分布式训练,探索了混合精度训练、算子和编译的优化,使大模型训练成本降低了 60%,加速比超过 96%。在机器学习任务中,数据处理经常占用大部分时间。毫末智行还通过标注过程自动化,将数据标注的效率自动化率提升到了 80%,大幅减少了自动驾驶算法训练的成本。通过与大算力平台深度融合,自动驾驶认知能力得到了飞速提升,这些技术进步终于让城市智能驾驶成为了可能。国内首个量产城市辅助驾驶系统 HPILOT 3.0,今年上线目前,国内高速公路里程约 16 万公里,城市道路里程则早已突破 1000 万公里,在其范围内还有 40 万个城市路口和 130 万个红绿灯。根据毫末的数据,在城市场景下的通勤,有 85% 是拥堵和半拥堵情况。拥堵变道、借道绕障、路口博弈、非机动车出现是城市辅助驾驶必须面临的问题。毫末目前已完成了城市 NOH 的全部功能开发,其数据智能体系 MANA 的学习时长达 197273 小时,虚拟驾龄相当于人类司机 2 万年。毫末即将推出的下一代城市智能驾驶系统 HPilot 3.0 将配备 AI 算力 360T,高速缓存 144M,CPU 计算能力达到 200K+DMIPS 的新一代自动驾驶芯片。全车搭载 2 个激光雷达、12 个摄像头,5 个毫米波雷达形成的多冗余感知体系。城市 NOH 能够根据导航路线在城市环境中应对各种复杂交通场景,实现城市区域内点到点安全、轻松的智慧出行。根据目前的测试,该系统实现了 70% 路口通过率,变道成功率 90%。仅用一年多时间,毫末智行就帮助长城完成了智能驾驶能力的升级,率先站在了下一阶段城市智能驾驶的起跑线上。在国内除毫末智行外,目前仅有小鹏明确表示将在今年上线城市辅助驾驶能力。毫末为今年制定的目标是 NOH 系统覆盖超过 30 款新车。在未来两年,搭载毫末辅助驾驶系统的乘用车数量将超过 100 万台。按照这一目标,毫末将在未来持续保持中国量产自动驾驶第一名的位置。「随着自动驾驶、辅助驾驶的成熟,这些新技术不仅能够有效保障交通参与者的生命安全,还能够逐步释放驾驶者的驾驶时间,缓解驾驶疲劳,获得出行效用的提升,」顾维灏表示。在大规模量产后,毫末智行智能驾驶的核心——MANA数据智能,势必将会随数据和技术的积累,在业内树立标杆。
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。 这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。 “内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。