首页> 标签> 自动驾驶
"自动驾驶"
共 3052 条结果
全部 问答 文章 公开课 课程 电子书 技术圈 体验
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
文章
人工智能  ·  自然语言处理  ·  自动驾驶  ·  安全  ·  机器人  ·  语音技术  ·  云计算  ·  计算机视觉  ·  AI芯片
2022-05-12
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
文章
人工智能  ·  自然语言处理  ·  自动驾驶  ·  安全  ·  机器人  ·  语音技术  ·  云计算  ·  计算机视觉  ·  AI芯片
2022-05-12
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
文章
人工智能  ·  自然语言处理  ·  自动驾驶  ·  安全  ·  机器人  ·  语音技术  ·  云计算  ·  计算机视觉  ·  AI芯片
2022-05-12
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
文章
人工智能  ·  自然语言处理  ·  自动驾驶  ·  安全  ·  机器人  ·  语音技术  ·  云计算  ·  计算机视觉  ·  AI芯片
2022-05-11
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
文章
人工智能  ·  自然语言处理  ·  自动驾驶  ·  安全  ·  机器人  ·  语音技术  ·  云计算  ·  计算机视觉  ·  AI芯片
2022-05-11
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
文章
人工智能  ·  自然语言处理  ·  自动驾驶  ·  安全  ·  机器人  ·  语音技术  ·  云计算  ·  计算机视觉  ·  AI芯片
2022-05-11
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。这一幕如同刘慈欣小说《三体》里所描述的,智子封锁的地球科技一样,被信息干扰,或引导至错误方向发展,困在原地,做困兽之斗,无法自拔。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。科技的未来,不是消费互联网,而是产业互联网。黄奇帆在中国互联网大会上斩钉截铁地说,“今后十年是产业互联网时代”。互联网的未来是产业互联网,产业互联网的价值以及远景是怎样的?2021年8月18日的百度世界大会,告诉我们关于未来的某些可能性,从某种意义上来说,百度正在扮演着中国科技的“破壁人”角色。硬科技背后需要软实力沉淀和积累百度世界大会,是百度公司的一个传统,这既是百度向公众披露其运营和战略的路演,也是公众了解百度的一个窗口。2021年的百度世界大会与以往最大的不同,可能是,这一次百度发布了更多的“硬科技”产品。比如惊艳一时的百度汽车机器人,比如温情脉脉的小度智能巨屏电视、小度智能词典笔、小度主动降噪智能耳机Pro、添添旋转智能屏,以及宣布量产的百度第二代昆仑AI芯片“昆仑芯2”。一致的行业现象是,科技企业都在逐渐从它们软件的实力向硬件渗透。百度这些“硬科技”的背后,是其软件实力的支撑。比如,百度的“汽车机器人”,它需要多重能力:首先具备L5级别自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外,汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。百度的这款“汽车机器人”已经达到了L5级别的自动驾驶,它是一辆没有方向盘汽车,这是自动驾驶的终极形态,无需人类驾驶的同时,还能有更多驾驶之外的服务。这也是命名“汽车机器人”的原因所在吧。又比如,小度发布的四款产品,是百度AI人格化和服务化两大发展方向上各种技术沉淀和积累的集中展现。譬如语音识别技术,百度的语音识别技术准确率达到了98%,甚至超过人耳水平。这四款是将语音识别技术、百度AI等与智能生活结合,针对不同场景开发的产品,用户可以通过语音控制家中的电器、窗帘、台灯,通过智能词典笔,可以识别翻译各种外语,通过添添旋转屏可以K歌、刷短视频、点外卖、在线支付等。小度这四款硬件科技,将百度APP智能搜索、百度健康医典、AI智慧社区等一些列内容沉淀与技术积累集合在一起。这一系列的硬科技的背后,延续了一句传统的老话,“科技以人文本”。值得注意的是,这一系列的硬科技产品的“爆发式”发布,绝非一蹴而就,严格来说,这是百度在AI领域持续投入超过十年的一次检验。百度的案例预示着,产业互联网是软硬结合的。互联网未来是产业基础,云计算+AI有人说,互联网的未来是云与智能,将两者的结合,可能就是AI。百度世界大会前一天,2021年8月17日,国务院签署并公布了《关键信息基础设施安全保护条例》,该条例与《网络安全法》相呼应,一系列法规的制定和执行落地,预示一点:互联网已经成为国民生活和国民经济的基础设施。这也意味着,云计算将是基础之一,在云计算的基础上,则是AI智能。云计算是对产业数字化的支撑,人工智能则是加速产业的智能化升级,“赋能千行百业”。云计算市场是目前国内一众科技企业中竞争最为激烈的,国际市场上有亚马逊、微软、阿里云、Google,国内除了阿里云,还有腾讯、华为。百度云起步较阿里云稍晚,但这并不妨碍它的后发优势。前不久百度公布了2021年第二季度财报, 云计算的增长尤为抢眼,它保持了同比71%的增速,领跑中国云计算市场,跻身第四。从2018年到2020年,百度云智能服务收入分别为30亿、64亿和92亿,按照71%的增速,今年将突破150亿元大关。百度云的“后发优势”,是云计算与AI的结合,百度采用了“AI云”作为标识与其他公有云做区别。可以将“AI云”看作是,“数字化底座”+“智能化引擎”的结合,这也意味着,AI云能够在制造、能源、城市、金融、医疗、媒体等领域,给客户数字化转型和智能化升级一步到位。体现在财务上,也许是,“AI云”毛利要远高于公有云。今年的百度世界大会,主题是“AI这时代,星辰大海”,李彦宏在直播中说,“AI,也是爱,是技术和温度结合在一起。”,“让每一个人都感受到技术带来的改变,这就是技术的价值”。AI的发展,一方面是融入到每个人的衣食住行,变得触手可及,另一方面则是产业智能化升级赋能。消费互联网与产业互联网的升级,体现在这一次百度发布的“百度大脑7.0”,百度大脑融合创新,降低门槛的优势。在泉州,百度为泉州水务搭建了“水务大脑”,百度智能云提供的AI用水量预测模型可结合历史用水数据、天气、季节等变化因素,精准预测用水量,实现按需供水。同时,加压泵站精准调压应用,通过分析运行工况,可动态调整泵站流量、压力、频率等参数,大大降低泵机功耗,科学准确调控水压。在新疆,艰苦的人力电力巡检工作也正在被百度AI代替。机器设备将拍摄的影像资料传回,通过AI技术可以快速判断线路是否存在故障,这样巡检效率得到了大幅提升,与此同时,巡检工人的工作环境也得到巨大改善,保障了边疆人民千家万户的用电安全。应该说,产业互联网是千行百业拥抱互联网,也是AI商业化的标志。透过这次百度世界大会,我们看到百度AI的商业化步伐明显加快,AI远比我们所预想的更快进入落地周期,与此同时,随着国内数字新基建的开启,有更早AI布局和更久技术沉淀的企业将在新的周期里全面提速。告别路径依赖,未来从畅想变现实随着滴滴因数据问题受到调查,新一轮的移动出行大战也上演了。与其他互联网不同的是,移动出行网约车大战,被认为是互联网改造传统行业的先声。这一轮出行大战,如高德、美团、T3等也重复着历史,延续了往日滴滴最为成功的补贴方式。很多互联网从业者未曾想过,这种疯狂烧钱的补贴,也是今天互联网备受争议和指责的原因之一。黄奇帆曾说,当前消费互联网领域的四个问题是:烧钱扩规模以取得行业垄断,利用人性弱点设计产品,利用垄断地位采集信息侵犯隐私,互联网杀熟。烧钱扩规模的前提是构建在存量市场。互联网的下一阶段,产业互联网这种烧钱扩大规模的方式或许不在适用,真正应该做的,是寻求产业的增量和效率最大化。如果将滴滴为代表的移动出行视为产业互联网的先声,那么出行领域的未来一定是更为智能的自动驾驶。财报分析师会议上,李彦宏确认,百度最新的robotaxi的软硬件系统,实现了60%的成本骤降,并且有望最快在2025年低于网约车。截至2021年上半年,百度Apollo自动驾驶出行服务已累计接待乘客超过40万人次,测试里程超过1400万公里,自动驾驶专利数量达3000件。李彦宏曾经分享过“3,30,3000”计划,即3年、30城、3000辆Robo Taxi,这是一个循序渐进的过程。从滴滴出行到百度的未来驾驶业务,我们可以看出,产业互联网与消费互联网的本质差异:滴滴为代表的移动出行,更多的是通过互联网的手段,做交易信息的匹配;未来的驾驶业务,则是在交易信息匹配的基础上,做更多产业端的供给侧结构性改革——通过智能化、数据化方式,降低供给侧的成本,提升消费端的体验和效率。百度的“汽车机器人”就是建立在Robotaxi技术和运营沉淀基础上,除了惊艳的“汽车机器人”,更让大众兴奋的可能是,百度发布的无人车出行服务平台——“萝卜快跑”。“萝卜快跑”并不是简单的为“Robotaxi”赋予一个中文名字这么简单,更为重要的是,Robotaxi象征着概念、研发和技术沉淀,“萝卜快跑”则意味着,经过8年发展,百度Apollo已经从技术验证阶段进入到规模化商业运营阶段。IHS 报告显示,预计整个共享出行市场的市场规模在2030年将达到2.25万亿元人民币,复合增长率在20% - 28%之间。在共享出行市场中,Robotaxi将占到60%以上,市场规模超过1.3万亿。这也意味着,未来出行市场将转向无人车服务场景。造车新势力与网约车激战的当下,萝卜快跑的上线显得格外有意义,这意味着,自动驾驶下半场的角逐已经开启,规模化商业运营成为行业发展的重点,这也是对传统网约车赛道的一次换道超越。百度Apollo在过去两年,分别在北京、长沙、广州、沧州四个城市运营,目前也增获25个城市的运营牌照,距离30城的计划又进一步。萝卜快跑的上线,随着城市、乘客、公里数的不断增加和累积,也会进一步优化百度汽车机器人的迭代和升级。也就是说,萝卜快跑兼顾了科技的商业现实和未来畅想。
文章
人工智能  ·  自然语言处理  ·  自动驾驶  ·  安全  ·  机器人  ·  语音技术  ·  云计算  ·  计算机视觉  ·  AI芯片
2022-05-11
深度学习教程 | 卷积神经网络解读
作者:韩信子@ShowMeAI教程地址:http://www.showmeai.tech/tutorials/35本文地址:http://www.showmeai.tech/article-detail/221声明:版权所有,转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为吴恩达老师《深度学习专项课程(Deep Learning Specialization)》学习与总结整理所得,对应的课程视频可以在这里查看。引言在ShowMeAI前一篇文章 AI应用实践策略(下) 中我们对以下内容进行了介绍:错误分析(error analysis)错误标签情况及修正数据分布和数据不匹配问题及解决办法迁移学习多任务学习端到端学习本篇开始,我们对吴恩达老师第4门课《Convolutional Neural Networks》(卷积神经网络) 做总结梳理。内容主要覆盖卷积神经网络(CNN)的基本概念、模型和具体应用等。1.计算机视觉计算机视觉(Computer Vision)的高速发展标志着新型应用产生的可能,例如自动驾驶、人脸识别、创造新的艺术风格。人们对于计算机视觉的研究也催生了很多计算机视觉与其他领域的交叉成果。如下是一些典型的计算机视觉场景应用场景:后面部分ShowMeAI会根据吴恩达老师的课程给大家讲到以下CV应用:图片分类(Image Classification)目标检测(Object detection)神经风格转换(Neural Style Transfer)使用传统神经网络处理机器视觉面临的一个挑战是数据的输入可能会非常大。例如一张 的图片,神经网络输入层的维度将高达三百万,使得网络权重 非常庞大。这样会造成两个后果:神经网络结构复杂,数据量相对较少,容易出现过拟合。所需内存和计算量巨大。因此,一般的神经网络很难处理海量图像数据。解决这一问题的方法就是使用特殊结构的神经网络:卷积神经网络(Convolutional Neural Network, CNN)。2.卷积运算前面的文章里讲到过,神经网络由浅层到深层,分别可以检测出不同层次的信息,在计算机视觉中我们依托深度卷积神经网络,来依次学习理解图片的边缘特征、局部特征(例如眼睛、鼻子等),直至最后一层综合前面检测的特征来识别整体图像内容。卷积运算(Convolutional Operation)是卷积神经网络最基本的组成部分。我们以边缘检测为例,来解释卷积是怎样运算的。2.1 边缘检测如下图所示,以人脸识别为例,神经网络由浅层到深层,分别可以检测出图片的边缘特征 、局部特征(例如眼睛、鼻子等)、整体面部轮廓等。图片最常做的边缘检测有两类:垂直边缘(Vertical Edges)检测和水平边缘(Horizontal Edges)检测。图片的边缘检测可以通过与相应滤波器进行卷积来实现。以垂直边缘检测为例,原始图片尺寸为 ,中间的矩阵被称作滤波器(filter),尺寸为 ,卷积后得到的图片尺寸为 ,得到结果如下(数值表示灰度,以左上角和右下角的值为例):上图只显示了卷积后的第一个值和最后一个值。卷积运算的求解过程是从左到右,由上到下,每次在原始图片矩阵中取与滤波器同等大小的一部分,每一部分中的值与滤波器中的值对应相乘后求和,将结果组成一个矩阵。下图对应一个垂直边缘检测的例子:如果将最右边的矩阵当作图像,那么中间一段亮一些的区域对应最左边的图像中间的垂直边缘。这里有另一个卷积运算的动态的例子,方便理解:图中的 * 表示卷积运算符号。在计算机中这个符号表示一般的乘法,而在不同的深度学习框架中,卷积操作的API定义可能不同:在Python中,卷积用 conv_forward() 表示;在Tensorflow中,卷积用 tf.nn.conv2d() 表示;在Keras中,卷积用 Conv2D() 表示。2.2 更多边缘检测的例子如果将灰度图左右的颜色进行翻转,再与之前的滤波器进行卷积,得到的结果也有区别。实际应用中,这反映了由明变暗和由暗变明的两种渐变方式。可以对输出图片取绝对值操作,以得到同样的结果。垂直边缘检测滤波器和水平边缘检测滤波器如下所示,其他常用的滤波器还有Sobel滤波器和Scharr滤波器,它们增加了中间行的权重,以提高结果的稳健性。滤波器中的值还可以设置为参数,通过模型训练来得到。这样,神经网络使用反向传播算法可以学习到一些低级特征,从而实现对图片所有边缘特征的检测,而不仅限于垂直边缘和水平边缘。3.填充padding观察上述卷积图片,我们假设输入图片的大小为 ,而滤波器的大小为 (注意 一般为奇数),则卷积后的输出图片大小为 。这样的处理会带来两个问题:每次卷积运算后,输出图片的尺寸缩小。原始图片的角落、边缘区像素点在输出中采用较少,输出图片丢失边缘位置的很多信息。为了解决这些问题,可以在进行卷积操作前,对原始图片在边界上进行填充(Padding),以增加矩阵的大小,保证输出的尺寸以及边缘位置信息的有效利用。我们通常用 进行填充。设每个方向扩展像素点数量为 ,则填充后原始图片的大小为 ,滤波器大小保持 不变,则输出图片大小为 。有两种对于 的设置是最常见的:Valid卷积:不进行填充,直接卷积。结果大小为 Same卷积:进行填充,并保证卷积后结果大小与输入一致,此时 在计算机视觉领域, 通常为奇数。原因包括 Same 卷积中 能得到自然数结果,并且滤波器有一个便于表示其所在位置的中心点。4.卷积步长卷积过程中,有时需要通过填充来避免信息损失,有时也需要通过设置步长(Stride)来压缩一部分信息。步长表示滤波器在原始图片的水平方向和垂直方向上每次移动的距离。之前,步长被默认为 。而如果我们设置步长为2,则卷积过程如下图所示:设步长stride为 ,padding填充大小为 ,输入图片大小为 ,滤波器大小为 ,则卷积后图片的尺寸为:上述公式中有一个向下取整的符号,用于处理商不为整数的情况。我们前面看到的「卷积」实际上是互相关(cross-correlation),而非数学意义上的卷积。真正的卷积操作在做元素乘积求和之前,要将滤波器沿水平和垂直轴翻转(相当于旋转180度)。因为这种翻转对一般为水平或垂直对称的滤波器影响不大,按照机器学习的惯例,我们通常不进行翻转操作,在简化代码的同时使神经网络能够正常工作。5.高维卷积如果我们想要对三通道的RGB图片进行卷积运算,那么其对应的滤波器组也同样是三通道的。过程是将每个单通道 与对应的滤波器进行卷积运算求和,然后再将三个通道的和相加,将这27个乘积的和作为输出图片的一个像素值。实际的计算过程也同样会滑动覆盖所有输入通道和图片全部输入像素,如下动图所示:不同通道的滤波器可以不相同。例如只检测 通道的垂直边缘, 通道和 通道不进行边缘检测,则 通道和 通道的滤波器全部置零。当输入有特定的高、宽和通道数时,滤波器可以有不同的高和宽,但通道数必须和输入一致。如果想同时检测垂直和水平边缘,或者更多的边缘检测,可以增加更多的滤波器组。例如第1个滤波器组实现垂直边缘检测,第2个滤波器组实现水平边缘检测。设输入图片的尺寸为 ( 为通道数),滤波器尺寸为 ,则卷积后的输出图片尺寸为 , 为滤波器组的个数。如下动图为2个滤波器对输入进行卷积计算得到输出的过程。6.卷积神经网络单层结构6.1 CNN单层结构卷积神经网络的单层结构如下所示:与上面提到的卷积过程相比较,卷积神经网络的单层结构多了激活函数(上图使用的ReLU)和偏置量b;对比标准神经网络:卷积神经网络把上式中 与 的乘积运算换成了卷积运算,滤波器的取值对应着权重 ,激活函数选择ReLU。我们重点来看一下上图中参数的数目:每个滤波器组有 个参数,还有1个偏移量b,则每个滤波器组有 个参数,两个滤波器组总共包含 个参数。而且大家会发现,一旦确定滤波器组,则参数数量就确定了,它与输入图片尺寸无关。大尺寸的图片也并不会在卷积层带来巨大的参数量。一张 的图片,标准神经网络输入层的维度将达到3百万,而在CNN中,参数数目只由滤波器组决定,数目相对来说要少得多,在如上的卷积神经网络层结构中,依旧只需要 个参数。6.2 CNN标记符号梳理总结为了更规范,我们来约定一下CNN单层结构标记符号,设 层为卷积层: :滤波器的高(或宽) :填充长度 :步长 :滤波器组的数量输入维度: 其中 表示输入图片的高, 表示输入图片的宽。之前的示例中输入图片的高和宽都相同,但是实际中可以是不同的,我们在这里加上下标予以区分。每个滤波器组的维度: 。其中 为输入图片通道数(也称深度)。权重维度: 偏置维度: 输出维度: 。其中对于m个样本的向量化运算,相应的输出维度为: 7.简单卷积网络示例下图为1个简单的CNN模型,我们来分析一下它的结构:图示网络中, 的维度为 ,将其平展成1960维的单列形式,然后连接最后的输出层。输出层可以是一个神经元,即二元分类(logistic);也可以是多个神经元,即多分类(Softmax)。最后得到预测输出 。在典型的CNN结构里,随着神经网络计算深度不断加深,输入的高度和宽度 、 一般逐渐减小,而 在增加。卷积神经网络包含有三种典型的层结构:卷积层(Convolution layer)池化层(Pooling layer,也有译作「汇合层」)全连接层(Fully Connected layer)仅用卷积层也有可能构建出很好的神经网络,但很多神经网络还是会添加池化层和全连接层,它们更容易设计。8.池化层很多CNN中都会包含Pooling layers池化层,池化层的作用是缩减模型的大小,提高计算速度,同时减小噪声提高所提取特征的稳健性。8.1 最大池化Max Pooling有不同的池化操作,比较常见的一种叫做最大池化(Max Pooling)。将输入拆分成不同的区域,输出的每个元素都是对应区域中元素的最大值,如下图所示:类比卷积过程,上图所示的池化过程中相当于使用了一个大小 的滤波器,且池化步长 。卷积过程中的几个计算大小的公式也都适用于池化过程。如果有多个通道,那么就对每个通道分别执行计算过程。对最大池化的一种直观解释是,元素值较大可能意味着池化过程之前的卷积过程提取到了某些特定的特征,池化过程中的最大化操作使得只要在一个区域内提取到某个特征,它都会保留在最大池化的输出中。但是,没有足够的证据证明这种直观解释的正确性,而最大池化被使用的主要原因是它在很多实验中的效果都很好。8.2 平均池化Average Pooling还有一种大家可能会见到的池化过程是平均池化(Average Pooling),它会对对应区域求平均值输出:8.3 池化层总结池化过程的特点之一是,它有一组超参数,但是并没有参数需要学习。池化过程的超参数包括滤波器的大小 、步长 ,以及选用最大池化还是平均池化。而填充 则很少用到。池化过程的输入维度为: 输出维度为: 9.卷积神经网络示例在计算神经网络的层数时,通常只统计具有权重和参数的层,因此池化层通常和之前的卷积层共同计为一层。图中的FC3和FC4为全连接层,与标准的神经网络结构一致。整个神经网络各层的尺寸与参数如下表所示:层次输出维度输出大小参数量Input(32, 32, 3)30720CONV1(f=5, s=1)(28, 28, 6)4704158POOL1(14, 14, 6)11760CONV2(f=5, s=1)(10, 10, 16)1600416POOL2(5, 5, 16)4000FC3(120, 1)12048120FC4(84, 1)8410164Softmax(10, 1)10850推荐大家通过 直观感受卷积神经网络的网站 对CNN进行调试和可视化。10.使用卷积的原因根据前面的知识学习,大家知道,CNN相比于标准神经网络,能更好地适应高维度的大输入,其卷积设计有效地减少了CNN的参数数量。总结如下:参数共享(Parameter sharing):特征检测如果适用于图片的某个区域,那么它也可能适用于图片的其他区域。即在卷积过程中,不管输入有多大,一个特征探测器(滤波器)就能对整个输入的某一特征进行探测。稀疏连接(Sparsity of connections):在每一层中,由于滤波器的尺寸限制,输入和输出之间的连接是稀疏的,每个输出值只取决于输入在局部的一小部分值。池化的设计,在卷积之后很好地聚合了特征,通过降维来减少运算量。另外,吴恩达老师也说明了,由于CNN参数数量较小,所需的训练样本就相对较少,因此在一定程度上不容易发生过拟合现象。并且CNN比较擅长捕捉区域位置偏移。即进行物体检测时,不太受物体在图片中位置的影响,增加检测的准确性和系统的健壮性。参考资料直观感受卷积神经网络的网站ShowMeAI系列教程推荐大厂技术实现 | 推荐与广告计算解决方案大厂技术实现 | 计算机视觉解决方案大厂技术实现 | 自然语言处理行业解决方案图解Python编程:从入门到精通系列教程图解数据分析:从入门到精通系列教程图解AI数学基础:从入门到精通系列教程图解大数据技术:从入门到精通系列教程图解机器学习算法:从入门到精通系列教程机器学习实战:手把手教你玩转机器学习系列深度学习教程 | 吴恩达专项课程 · 全套笔记解读自然语言处理教程 | 斯坦福CS224n课程 · 课程带学与全套笔记解读推荐文章深度学习教程 | 深度学习概论深度学习教程 | 神经网络基础深度学习教程 | 浅层神经网络深度学习教程 | 深层神经网络深度学习教程 | 深度学习的实用层面深度学习教程 | 神经网络优化算法深度学习教程 | 网络优化:超参数调优、正则化、批归一化和程序框架深度学习教程 | AI应用实践策略(上)深度学习教程 | AI应用实践策略(下)深度学习教程 | 卷积神经网络解读深度学习教程 | 经典CNN网络实例详解深度学习教程 | CNN应用:目标检测深度学习教程 | CNN应用:人脸识别和神经风格转换深度学习教程 | 序列模型与RNN网络深度学习教程 | 自然语言处理与词嵌入深度学习教程 | Seq2seq序列模型和注意力机制
文章
机器学习/深度学习  ·  人工智能  ·  算法  ·  自动驾驶  ·  数据挖掘  ·  TensorFlow  ·  算法框架/工具  ·  计算机视觉  ·  Python  ·  自然语言处理
2022-04-21
耗时2天,我自制了一台体感游戏机
大家好,欢迎来到 Crossin的编程教室~几天不见,Crossin 又去做什么游戏去了呢?这次我做的不是游戏,而是游戏机!而且是体感游戏机。说到体感游戏,现在大家可能最多想到的是 switch 上的健身环大冒险。但往前几年,其实还有另一个非常火的体感游戏设备,就是 xbox 上的 kinect。和 switch 用带有传感器的手柄来识别玩家动作不同,kinect 使用的是一组摄像头,通过图像来识别玩家的动作。我这次做的 demo,就是一个使用摄像头的动作识别系统。理论上来说,这个识别系统只需要普通的电脑和普通的摄像头就可以运行。不过我最近正好拿到一样好东西,它可以让我这次的开发效率和运行效率都大大提高。这就是我说的好东西,全名是 Jetson AGX Orin,是 NVIDIA 的AI边缘计算设备。什么叫做边缘计算,简单来说就是对于数据的处理尽可能和产生数据的应用在一起。比如像机器人、像自动驾驶。这种场景对计算的实时性要求高,不好说把数据传到计算中心,靠机房的大家伙们处理完再把结果返回给设备。所以对于边缘计算设备来说,一是要计算能力够强,二就是要足够小,不仅是体积小,而且要能耗小。这款 AGX Orin 就是 NVIDIA Jetson 系列的最新款。新到什么程度,就是目前市面上还没有现货可以买,只能预定。所以我这台可以说是一个全球限量版。和之前上一代 Jetson AGX Xavier 相比,它的性能提升到了8倍,可达到每秒 275 万亿次计算。这个程度已经相当于内置了GPU的服务器,而它的大小则小到可以托在手掌上。除了强大的硬件之外,这里面自然也少不了 NVIDIA AI 相关软件的支持。并且对于大多数常见AI应用,比如人脸识别、物体识别、动作识别、自然语言处理、语音合成等等等等,它都提供了一些预训练好的模型。这个简直太方便了。开机安装好 JetPack 开发套件,这里就有了很多可以运行的测试程序来让你体验。官方文档里也提供了很多示例来帮助开发者上手。这里是我运行视觉和对话式AI基准测试的结果:可以看到跟上一代产品相比有非常显著提升:在官方的 Hello AI World 里,也提供了一些 demo。比如物体识别,识别一帧画面只需要十几毫秒,完全可以用在实时的视频监控,甚至正在进行的游戏当中。还有这样一个 demo:好家伙,这不我一半的工作量已经完成了嘛。拿到人体姿态数据之后,我们就可以用各种动作对应的数据来训练一个分类器。然后通过分类器来识别摄像头实时拍摄到的用户姿态,判断出动作。再根据识别出的动作,向系统发送键盘指令。这样就完成了一个简单的基于人体动作的交互系统。在 NVIDIA 智能物联网的 github 仓库里,我发现了一个类似的项目,用手势去操作浏览网页。https://github.com/NVIDIA-AI-IOT/trt_pose_hand里面使用 SVM 支持向量机来训练手势分类器,这个用到 Python 的 scikit-learn 模块。我们的第二部分也可以用同样的方法,只不过我们使用的是人体全身模型。为了训练出分类器,我们需要一点样本数据。之后,就是通过 pynput 模块发送键盘制令。将以上这些全部合在一起,就得到了我们想要的功能:一个可以用动作来玩游戏的系统视频演示:https://www.bilibili.com/video/BV1TY4y1r77J/对于 Orin 来说,用在这个项目上其实有点大炮打蚊子了,因为姿态判断和动作识别用的都是预训练模型,实时的计算量并不算大。但它的软件环境和开发社区资源确实大大提升了我这次的开发效率。唯一不足的就是从我家的网络连 github、apt、pip 都太慢了,以至于花了不少时间在环境安装上,如果相关资源能有一套国内镜像就更好了。最后有一个小彩蛋,你们是否留意到我用来演示的游戏 KOF97。在2009年,也就是 kinect 正式发布的前一年,我做的硕士毕业设计,其实就是:使用单摄像机的人机交互系统而在其中的动作识别部分,用的同样也是 SVM 支持向量机。在答辩时,我用的演示游戏,就是 KOF97在论文最后的工作展望里,我曾写到:没想到,在13年后,我自己把这个坑填上了。这不禁让我又想到乔布斯曾说的:相信我们生命中曾经经历的那些点,将在未来的某一天以某种方式串连起来。史蒂夫·乔布斯本文代码基于NVIDIA官方示例修改:https://github.com/NVIDIA-AI-IOT/trt_pose_hand运行环境:NVIDIA Jetson AGX OrinJetPack 5.0Python 3.8.10代码已开源:http://python666.cn/c/2获取更多教程和案例, 欢迎搜索及关注:Crossin的编程教室 每天5分钟,轻松学编程。
文章
机器学习/深度学习  ·  人工智能  ·  边缘计算  ·  自动驾驶  ·  机器人  ·  测试技术  ·  语音技术  ·  计算机视觉  ·  异构计算  ·  Python
2022-05-10
深度学习教程 | AI应用实践策略(下)
作者:韩信子@ShowMeAI教程地址:http://www.showmeai.tech/tutorials/35本文地址:http://www.showmeai.tech/article-detail/220声明:版权所有,转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为吴恩达老师《深度学习专项课程(Deep Learning Specialization)》学习与总结整理所得,对应的课程视频可以在这里查看。引言在ShowMeAI前一篇文章 AI应用实践策略(上) 中我们对以下内容进行了介绍:正交化方法(Orthogonalization)建立单值评价指标数据集划分要点人类水平误差与可避免偏差(Avoidable Bias)提高机器学习模型性能总结本篇是吴恩达老师第3门课《Structuring Machine Learning Projects》(构建机器学习项目)后半部分的总结梳理。内容主要覆盖误差分析、系统迭代、数据匹配与定位、迁移学习、多任务学习、端到端系统等。1.错误分析如果希望让学习算法能够胜任人类能做的任务,但学习算法还没有达到人类的表现,那么人工检查一下算法犯的错误可以了解接下来应该做什么,这个过程称为错误分析(error analysis)。假设正在调试猫分类器,取得了 准确率,相当于 错误,注意到算法将一些狗分类为猫,需要对模型的一些部分做相应调整,才能更好地提升分类的精度。1.1 收集错误样例在开发集(测试集)中,获取大约 个错误标记的例子,然后手动检查,一次只看一个,看看开发集里有多少错误标记的样本是狗。 个数据中有 个样例是狗,如果对数据集的错误标记做努力去改进模型的精度,可以提升的上限是 ,仅可以达到 的错误率,称为性能上限(ceiling on performance)。这种情况下,这样耗时的努力方向不是很值得的事。 个数据中,有 多个样例是狗,改进数据集的错误标记是一个值得的改进方向,可以将模型的精确度提升至 。这种错误分析虽然简单,但是能够避免花费大量的时间精力去做一些对提高模型性能收效甚微的工作,让我们专注解决影响模型正确率的主要问题,十分必要。错误分析可以同时评估多个影响模型性能的因素,通过各自在错误样本中所占的比例来判断其重要性。例如,猫类识别模型中,可能有以下几个可以优化的影响因素:修改那些被分类成猫的狗狗图片标签。修改那些被错误分类的大型猫科动物,如:狮子,豹子等。提升模糊图片的质量。可以建立表格来做并行的分析。如下图所示:在最左边,人工过一遍想分析的图像集,电子表格的每一列对应要评估的想法,如狗(Dog)的问题、猫科动物(Great cats)的问题、模糊图像(Blurry images)的问题,最后一列写评论(Comments)。在这个步骤做到一半时,可能会发现其他错误类型,比如可能发现有Instagram滤镜,那些花哨的图像滤镜,干扰了分类器。在这种情况下可以在错误分析途中,增加一列多色滤镜(Instagram滤镜和Snapchat滤镜),再过一遍,并确定新的错误类型百分比,这个分析步骤的结果可以给出一个估计,是否值得去处理每个不同的错误类型。最终汇总到上述这样的表格里,我们可以敲定更有效的优化策略:把团队可以分成两个团队,其中一个改善大猫的识别,另一个改善模糊图片的识别。1.2 小结总结一下,进行错误分析时,你应该观察错误标记的例子,看看假阳性和假阴性,统计属于不同错误类型的错误数量(如上图)。在这个过程中,你可能会得到启发,归纳出新的错误类型。总之,通过统计不同错误标记类型占总数的百分比,有助于发现哪些问题亟待解决,或者提供构思新优化方向的灵感。2.修正错误标记我们用mislabeled examples来表示学习算法输出了错误的 值。而在做错误分析时,有时会发现数据集中有些样本被人为地错误标记(incorrectly labeled)了,这时该如何处理呢?2.1 训练集错标如果是在训练集中,由于机器学习算法对于随机误差的稳健性(Robust)(也称作「鲁棒性」),只要这些出错的样本数量较小,且分布近似随机,就不必花费时间一一修正。2.2 验证集/测试集错标如果是验证集与测试集中出现错标样本,该怎么处理呢?方法很简单,使用上一小节内容介绍的错误分析方法,统计验证集中所有分类错误的样本中错标数据的占比。根据占比大小,决定是否需要修正所有错标数据,还是可以忽略。如下举例说明:(1) case1如果评估算法后,是如下这种情况:总体验证集错误率:错标样本错误率:其他原因引起的错误率:上面情况下错标样本引起的验证集错误率占比仅为 ,占验证集错误情况的 ,而其它类型错误占验证集错误情况的 。这种情况下,可以忽略错标数据。(2) case2如果评估算法后,是如下这种情况:总体验证集错误率:错标样本错误率:其他原因引起的错误率:上面情况下错标样本引起的验证集错误率占比依然为 ,但是却占验证集错误情况的 ,而其它类型错误占验证集错误情况的 。这种情况下,错标数据不可忽略,需要手动修正。通过前面的内容,我们了解到验证集的主要作用是「在不同算法之间进行比较,选择错误率最小的算法模型」。但是,如果验证集有错标数据的存在,当不同算法错误率比较接近的时候,我们无法仅仅根据总体验证集的效果判断哪个算法模型更好,必须修正错标数据。关于修正错标数据,吴恩达老师还给出了一些建议:在验证集和测试集上同时使用同样的修正手段,以保证验证集和测试集来自相同的分布。同时检查判断正确和判断错误的例子(通常不用这么做)。在修正验证集和测试集时,鉴于训练集的分布不必和验证/测试集完全相同,可以不去修正训练集。3.快速搭建系统并迭代如果我们想搭建一个全新的机器学习系统,吴恩达老师建议根据以下步骤快速搭建好第一个系统,然后反复迭代优化:设置好训练、验证、测试集及衡量指标,确定目标。快速训练出一个初步的系统,用训练集来拟合参数,用验证集调参,用测试集评估。通过偏差/方差分析以及错误分析等方法,决定下一步优先处理的方向。4.在不同的分布上训练和测试有时,我们很难得到来自同一个分布的训练集和验证/测试集。当训练集与验证/测试集不来自同一个分布的时候,我们应该如何解决这一问题,构建准确的机器学习模型呢?仍以猫识别作为例子,我们的训练集可能由网络爬取得到,图片比较清晰,而且规模较大(例如20万);而验证/测试集可能来自用户手机拍摄,图片比较模糊,且数量较小(例如1万),难以满足作为训练集时的规模需要。虽然验证集测试集图片质量不高,但是模型最终主要应用在对这些模糊的照片的处理上。有两种解决方法处理训练集和验证/测试集分布不一致:①方法1:将训练集和验证/测试集完全混合,然后再随机选择一部分作为训练集,另一部分作为验证/测试集。例如,混合 例样本,然后随机选择 例样本作为训练集, 例作为验证集, 例作为测试集。这种做法的优点是实现训练集和验证/测试集分布一致。缺点是验证/测试集中 webpages 图片所占的比重比 mobile app 图片大得多。(例如dev set包含 例样本,大约有 例来自 webpages,只有 例来自 mobile app。算法模型对比验证仍然主要由 webpages 决定,实际应用的 mobile app 图片所占比重很小,达不到验证效果。)②方法2:将原来的训练集和一部分验证/测试集组合当成训练集,剩下的验证/测试集分别作为验证集和测试集。例如, 例webpages图片和 例mobile app图片组合成训练集,剩下的 例mobile app图片作为验证集, 例mobile app图片作为测试集。这种做法的核心在于验证/测试集全部来自于 mobile app。这样保证了验证集最接近实际应用场合。这种方法较为常用,而且性能表现比较好。5.数据不匹配5.1 数据不匹配问题ShowMeAI上一篇内容 AI应用实践策略(上) 里介绍过,根据人类表现误差、训练误差和验证误差的相对差异可以判定是否出现了 bias 或者 variance。不过有一个问题:如果训练集和验证/测试集来源于不同分布,则无法直接根据相对值大小来判断。例如某个模型人类表现误差为 ,训练误差为 ,验证误差为 。按照 AI应用实践策略(上) 里的方法我们会判断该模型出现了 variance。但训练误差与验证误差之间的差值 可能来自算法本身(variance),也可能来自于样本分布不同。(比如dev set都是很模糊的图片样本,本身就难以识别,跟算法模型关系不大。)这种情况下,不能简单认为出现了variance。在可能伴有训练集与验证/测试集分布不一致的情况下,定位是否出现 variance 的方法是设置定义一个训练-验证集(Training-dev Set)。训练-验证集和训练集的分布相同(或者是训练集分割出的子集),但是不参与训练过程,而是用于验证。现在,我们有了训练集错误率、训练-验证集错误率,以及验证集错误率。其中,训练集错误率和训练-验证集错误率的差值反映了variance方差;而训练-验证集错误率和验证集错误率的差值反映了样本分布不一致的问题,从而说明模型擅长处理的数据和我们关心的数据来自不同的分布,我们称之为数据不匹配(Data Mismatch)问题。举例说明,如果训练集错误率为 ,训练-验证集错误率为 ,验证集错误率为 ,则 variance 方差问题比较突出。如果训练集错误率为 ,训练-验证集错误率为 ,验证集错误率为 ,则数据不匹配比较突出。通过引入训练-验证集,能够比较准确地定位出现了 variance 还是数据不匹配问题。总结人类水平误差、训练集错误率、训练-验证集错误率、验证集错误率、测试集错误率之间的差值所反映的问题如下图所示:5.2 处理方法吴恩达老师给出了2条关于解决数据不匹配问题的建议:① 做错误分析,尝试了解训练集和验证/测试集的具体差异(主要是人工查看训练集和验证集的样本);② 尝试将训练数据调整得更像验证集,或者收集更多类似于验证/测试集的数据。要将训练数据调整得更像验证集,我们可以使用人工数据合成方法(artificial data synthesis)。以语音识别问题为例,实际应用场合(验证/测试集)是包含背景噪声的,而作为训练样本的音频很可能是清晰而没有背景噪声的。为了让训练集与验证/测试集分布一致,我们可以给训练集人工添加背景噪声,合成类似实际场景的声音。人工合成数据能够使数据集匹配,从而提升模型的效果。但需要注意的是,不能给每段语音都增加同一段背景噪声,因为这样模型会对这段背景噪音出现过拟合现象,使得效果不佳。6.迁移学习迁移学习(Tranfer Learning)是通过将已训练好的神经网络模型的一部分网络结构应用到另一模型,将一个神经网络从某个任务中学到的知识和经验运用到另一个任务中,以加快训练学习速度和提升模型效果。例如,我们将为猫识别器构建的神经网络迁移应用到医疗影像诊断中。猫识别器神经网络训练完成后,已经学习到了一些有关图像的结构和性质等方面的知识,这时候只要先删除神经网络中原有的输出层,加入新的输出层并随机初始化权重系数 ,随后用新的训练集进行训练,就完成了以上的迁移学习。如果新的数据集很小,可能只需要重新训练输出层前的最后一层的权重,即 、,并保持其他参数不变;而如果有足够多的数据,可以只保留网络结构,重新训练神经网络中所有层的系数。这时初始权重由之前的模型训练得到,这个过程称为预训练(Pre-Training),之后的权重更新过程称为微调(Fine-Tuning)。上述过程的迁移学习会有效,是因为神经网络浅层部分能够检测出许多图片固有特征,例如图像边缘、纹理、曲线等。使用之前训练好的神经网络部分结果有助于我们更快更准确地提取 光片特征。二者处理的都是图片,而图片处理是有相同的地方,第一个训练好的神经网络已经帮我们实现如何提取图片有用特征了。因此,即便是即将训练的第二个神经网络样本数目少,仍然可以根据第一个神经网络结构和权重系数得到健壮性好的模型。你也可以不止加入一个新的输出层,而是多加几个新层。吴恩达老师指出,迁移学习适用于满足以下条件的场景:两个任务有同样的输入 (比如都是图像或者都是音频);拥有更多数据的任务迁移到数据较少的任务;某一任务的低层次特征 (底层神经网络的某些功能) 对另一个任务的学习有帮助。7.多任务学习除了我们前面讲到的构建神经网络解决二分类或者多分类任务,神经网络还可以完成多任务学习 (Multi-Task Learning),它指的是使用单个神经网络模型,利用共享表示采用并行训练同时学习多个任务。多任务学习的基本假设是多个任务之间具有相关性,并且任务之间可以利用相关性相互促进。例如,属性分类中,抹口红和戴耳环有一定的相关性,单独训练的时候是无法利用这些信息,多任务学习则可以利用任务相关性联合提高多个属性分类的精度。下面是一个汽车自动驾驶的例子。这个场景中需要实现的多任务是识别行人、车辆、交通标志和信号灯。多任务学习模型的成本函数及对应的损失函数为:其中, 代表任务下标,总有 个任务。多任务学习和 Softmax 回归看上去有些类似,容易混淆。它们的区别是,Softmax 回归的输出向量 中只有一个元素为 ;而多任务学习的输出向量 中可以有多个元素为 。吴恩达老师指出,多任务学习的应用场景有以下特质:训练的一组任务可以共用低层次特征;通常,每个任务的数据量接近;能够训练一个足够大的神经网络,以同时做好所有的工作。多任务学习会降低性能的唯一情况(即和为每个任务训练单个神经网络相比性能更低的情况)是神经网络还不够大。在多任务深度网络中,低层次信息的共享有助于减少计算量,同时共享表示层可以使得几个有共性的任务更好的结合相关性信息,任务特定层则可以单独建模任务特定的信息,实现共享信息和任务特定信息的统一。在实践中,多任务学习的使用频率要远低于迁移学习。计算机视觉领域中的物体识别是一个多任务学习的例子。8.端到端学习8.1 端到端学习与传统流水线在传统的机器学习分块模型中,每一个模块处理一种输入,然后其输出作为下一个模块的输入,构成一条流水线。而端到端深度学习(End-to-end Deep Learning)将所有不同阶段的数据处理系统或学习系统模块组合在一起,只用一个单一的神经网络模型来实现所有的功能。它将所有模块混合在一起,只关心输入和输出。如果数据量较少,传统机器学习分块模型所构成的流水线效果也不错。但如果训练样本非常大,应用的神经网络模型比较复杂,那么端到端深度学习模型的性能会比传统机器学习分块模型更好。而如果数据集规模适中,还是可以使用流水线方法,但是可以混合端到端深度学习,通过神经网络绕过某些模块,直接输出某些特征。如下是语音识别模型中传统流水线流程、混合模式和端到端学习模式的对比示意图。8.2 端到端学习优缺点如下是端到端学习的优缺点总结:优点只要有足够多的数据,剩下的全部交给一个足够大的神经网络。比起传统的机器学习分块模型,可能更能捕获数据中的任何统计信息,而不需要用人类固有的认知(或者说,成见)来进行分析所需手工设计的组件更少,简化设计工作流程缺点需要大量的数据排除了可能有用的人工设计组件总结一下,决定一个问题是否应用端到端学习的关键点是:是否有足够的数据,支持能够直接学习从$$x$$映射到$$y$$并且足够复杂的函数。ShowMeAI系列教程推荐大厂技术实现 | 推荐与广告计算解决方案大厂技术实现 | 计算机视觉解决方案大厂技术实现 | 自然语言处理行业解决方案图解Python编程:从入门到精通系列教程图解数据分析:从入门到精通系列教程图解AI数学基础:从入门到精通系列教程图解大数据技术:从入门到精通系列教程图解机器学习算法:从入门到精通系列教程机器学习实战:手把手教你玩转机器学习系列深度学习教程 | 吴恩达专项课程 · 全套笔记解读自然语言处理教程 | 斯坦福CS224n课程 · 课程带学与全套笔记解读推荐文章深度学习教程 | 深度学习概论深度学习教程 | 神经网络基础深度学习教程 | 浅层神经网络深度学习教程 | 深层神经网络深度学习教程 | 深度学习的实用层面深度学习教程 | 神经网络优化算法深度学习教程 | 网络优化:超参数调优、正则化、批归一化和程序框架深度学习教程 | AI应用实践策略(上)深度学习教程 | AI应用实践策略(下)深度学习教程 | 卷积神经网络解读深度学习教程 | 经典CNN网络实例详解深度学习教程 | CNN应用:目标检测深度学习教程 | CNN应用:人脸识别和神经风格转换深度学习教程 | 序列模型与RNN网络深度学习教程 | 自然语言处理与词嵌入深度学习教程 | Seq2seq序列模型和注意力机制
文章
机器学习/深度学习  ·  人工智能  ·  自然语言处理  ·  算法  ·  自动驾驶  ·  数据挖掘  ·  语音技术  ·  计算机视觉  ·  知识图谱  ·  Python
2022-04-21
1
...
11 12 13 14 15 16 17 18 19 20
跳转至:
人工智能
2623 人关注 | 9276 讨论 | 68356 内容
+ 订阅
  • 【每日算法Day 76】经典面试题:中序遍历的下一个元素,5大解法汇总!
  • 【每日算法Day 75】字节跳动面试题:手撕困难题,看过我Day 71的人都会做了!
  • 【每日算法Day 73】学妹大半夜私聊我有空吗,然后竟然做出这种事!
查看更多 >
云计算
21617 人关注 | 57898 讨论 | 38991 内容
+ 订阅
  • Elasticsearch 的 30 个调优
  • ECS使用体验
  • SpringCloud升级之路2020.0.x版-23.订制Spring Cloud LoadBalancer
查看更多 >
安全
1059 人关注 | 23287 讨论 | 55987 内容
+ 订阅
  • MySQL 8 如何修改密码
  • Spring Boot 操作 Redis 的各种实现
  • 用了这招, github访问更快了 使用场景
查看更多 >
开发与运维
5243 人关注 | 125834 讨论 | 201801 内容
+ 订阅
  • 【每日算法Day 76】经典面试题:中序遍历的下一个元素,5大解法汇总!
  • autojs 画 正弦 曲线
  • 【每日算法Day 75】字节跳动面试题:手撕困难题,看过我Day 71的人都会做了!
查看更多 >
大数据
184477 人关注 | 23063 讨论 | 56997 内容
+ 订阅
  • Spring Boot 操作 Redis 的各种实现
  • autojs之超椭圆
  • SpringCloud升级之路2020.0.x版-14.UnderTow AccessLog 配置介绍
查看更多 >