首页> 标签> 自动驾驶
"自动驾驶"
共 2984 条结果
全部 问答 文章 公开课 课程 电子书 技术圈 体验
​2020 AI Era 创新大奖发布!AI领军企业 TOP50 与创新先锋 TOP30 榜单揭晓(三)
作为5G新物种的云端机器人正逐渐走入人们的日常生活。成立于2015年的达闼科技是全球首家云端智能机器人运营商。何为云端机器人?简单讲,云端机器人将大脑计算和机器人本体分离,把大脑计算放在云端,实现集中控制和智能输出。目前,达闼科技主要专注于实现云端智能机器人运营级别的安全云计算网络、大型混合人工智能机器学习平台、以及安全智能终端和机器人控制器技术研究。疫情期间,不怕病毒的达闼机器人前往武汉方舱医院,协助医护人员派发医疗物资、打扫卫生、清洁消毒等,分担了繁重的抗疫工作,还与患者交流互动,为他们带去了生机与活力。Ginger XR-1 机器人,大家都称其为小姜,是达闼科技基于智能柔性执行器开发的商用人型服务机器人。配有34个先进的SCA智能柔性关节,活动自如。同时,小姜的眼睛集成2D和3D摄像头,底座还有超声雷达、惯性导航、立体声雷达。她能够完成穿针引线等高难度复杂动作,还有迎宾接待、端茶倒水、引导带路等服务工作。达闼科技创始人兼CEO黄晓庆曾表示,「云端机器人要具有类人的功能,就需要具有非常聪明的大脑、高速安全的网络控制、高度健壮的本体,5G让这一切成为可能。」目前,达闼科技已经根据不同的应用领域需求开发了多样化的云端机器人,如云端智能服务机器人、云端智能安保机器人、云端智能清洁机器人、云端智能零售机器人等。这些类人机器人,可以应用于社区、企业、校园、接待、零售、医院等多种场景。可以看出,达闼科技的机器人在现实生活中的多个场景实现落地应用,那么,腾讯也不例外。2020年11月,腾讯实验室的提出一种能让轮式机器人自主平衡的新方法,发明了四足机器人Jamoca。让人惊叹的是,四足机器人Jamoca竟学会了走梅花桩,成为国内首个能完成走梅花桩复杂挑战的四足机器人。这矫健的步伐,功夫着实到家!深兰科技被工业和信息化部科技司公布为「在科技支撑抗击新冠肺炎疫情中表现突出的人工智能企业」。在世界人工智能创新大赛上,该公司以领先的医疗AI产品及病毒检测技术,荣获「AIWIN医疗赛道十强」。深兰科技曾亮相2020世界人工智能大会云端峰会,发力工业智能化。AI 创新先锋 TOP30 榜单亮亮视野成功入选了本次AI创新先锋 TOP30 榜单。该公司成立于2014年,作为AR企业级服务拓荒者和领导者,提供相关硬件产品及软件服务,并广泛应用于工业、安防、医疗等行业。其旗下5G+AR采访眼镜在2020两会报道现场大显身手,帮助媒体记者快速「识别抓取」采访人物,成为解放双手、第一视角录直播的报道神器。亮亮视野目前已成为国内唯一实现规模商业化的AR眼镜产品及垂直行业解决方案服务商,在工业、安防、医疗等多个垂直领域的商业应用占有率位居首位。AI算力大显身手,机器人变成了白衣天使,云服务跨越式发展,自动驾驶入局......展望2021,「立基、上云、赋智」将促进传统产业的整体升级,使产业链更加智能化。
文章
机器学习/深度学习  ·  人工智能  ·  安全  ·  自动驾驶  ·  机器人  ·  5G  ·  vr&ar  ·  云计算
2022-01-16
Jeff Dean只是冰山一角!盘点劈柴哥的17个「贤内助」
谷歌前CEO Larry Page有一个「L队」,成员都是他信任高管和顾问,帮助他制定公司重大决策,那么皮采呢? 皮采的团队叫「Google Leads」,是一个17人小组,他们是谷歌最有权力的一批人,分管公司的搜索、广告、硬件和人力资源业务,帮助CEO掌舵这家科技巨头。根据外媒Business Insider最新披露的谷歌内部组织架构图,皮采的17人小组「Google Leads」如下,小组下属194名高管。今天,我们着重介绍其中的8位,他们分管谷歌人工智能、谷歌云、YouTube、法律事务等领域,来看看这些著名的谷歌service背后的老大吧。 不得不提——Jeff Dean17人小组中,有我们熟知的Jeff Dean——谷歌高级研究员,11级工程师,研究和健康部门的高级副总裁,领导谷歌人工智能部门。 1999年加入谷歌,是谷歌老员工,编程大牛。2011年加入谷歌X实验室,研究深层网络。 部门成员包括Geoffrey Hinton——VP,高级工程师研究员。 由X实验室最终产生了谷歌大脑,谷歌大脑是谷歌公司的研究小组,隶属于谷歌更广泛的研究小组,由 Dean负责监管。 在2018年的一次领导层重组中,Dean被任命为谷歌整个人工智能部门的负责人,这次重组将人工智能引入了自己的业务。在人工智能领域,谷歌的健康小组正在使用人工智能来推动它的许多项目。谷歌健康负责人David Feinberg向Dean汇报。 首席人力资源官Fiona Cicconi Fiona Cicconi今年1月刚刚加入谷歌,担任人力资源高管。Cicconi此前是阿斯利康的首席人力资源官,加盟谷歌后她将主管谷歌庞大的远程员工队伍,还要处理谷歌不断加剧的员工紧张局势。 此前,谷歌AI伦理部门两名研究人员Timnit Gebru和Margaret Mitchell相继被解雇,这引发了员工强烈的不满和抗议,今年年初,谷歌工会成立,鉴于最近几个月人们对于谷歌多样性、公平性和包容性承诺的质疑,这将成为未来Cicconi的工作重心。谷歌云CEO Thomas Kurian谷歌此前设定了DDL,2023年之前,谷歌云一定要超过至少一个竞争对手,虽然谷歌发言人后来否认了这一DDL,但云计算CEO Thomas Kurian仍面临着不小的压力。 2018年11月,这位甲骨文前高管被任命为谷歌云计算部门主管。上任之际他就表示:「你会看到我们的竞争将更加激烈」。 目前,Kurian正在兑现他的承诺——推动谷歌的企业业务赶上亚马逊AWS和微软Azure. 在他的领导之下,谷歌云集中于更多特定行业的产品和服务,而且据Kurian表示,2019年谷歌云的交易额超过5000万美元,翻了一番。 谷歌最近也开始将云计算收益作为一个独立的报告部门,这更加证明了这个部门目前的重要性。 Kurian的加入表明谷歌高层有意回归销售导向型的企业文化,这将有助于打破传统上对谷歌企业内部持怀疑态度的市场和合作伙伴。 Ruth Porat,谷歌和Alphabet的高级副总裁兼首席财务官 2015年,就在Alphabet成立的前几个月,这位摩根士丹利的高管加入谷歌,担任首席财务官。 Ruth Porat的到来并非巧合,Alphabet成立之后,她继续担任谷歌和Alphabet的首席财务官,是这家互联网帝国中最重要的人物之一。 她的职权范围包括Alphabet的「其他赌注」(Other Bets),这是一个集自动驾驶、生物技术和无人机等多项业务为一体的子公司,Porat控制着这些项目的资金和人数。 多年来,Porat为公司制定了很多财政规定,并在一些耗资巨大的项目中占据了主导地位。还引导谷歌度过了新冠,去年夏天谷歌的数字广告支出大幅下降,这对谷歌的业务来说是一个巨大的冲击。 Kent Walker,高级副总裁,全球事务和首席法律官作为谷歌全球事务的高级副总裁和首席法律官,Kent Walker是谷歌的首席律师。 彭博社称其为「你从未听过的科技界最有权势的人」。 Walker在法律和政策问题上为谷歌的领导团队提供咨询,这些问题涉及从公司收购到反垄断调查的方方面面。 目前,Walker和一些外部律师正在为谷歌公开辩护,反对反垄断诉讼的轰炸。 在2006年加入谷歌之前,这位毕业于斯坦福法学院的高材生曾在eBay 和网络浏览器先驱网景公司担任顶级法律顾问。此外,他还在美国司法部工作了五年。 Rick Osterloh,高级副总裁,负责硬件设备及服务Rick Osterloh2016年加入谷歌,此前他是摩托罗拉移动智能手机总裁。 在他的努力下,谷歌自有品牌的Pixel智能手机变成了一个家喻户晓的品牌。 据说,Rick Osterloh正在为Pixel手机和Chromebook开发自己的处理器。 2018年,Osterloh还接管了 Nest,目前他的下属负责谷歌的VR和AR产品。 Susan Wojcicki,YouTube首席执行官Susan是谷歌俱乐部的创始成员之一。 1998年,谷歌创始人拉里 · 佩奇和谢尔盖 · 布林在Susan家的车库创办了谷歌第一间办公室。 也是Susan在2006年提议收购了YouTube,现在15年过去了,创始人们肯定很高兴当初他们听了Susan的建议。 这位哈佛历史文学系的高材生把YouTube打造成了谷歌最成功的产品。 现在谷歌已经开始披露YouTube的收入,我们可以看到它是多么的成功。随着YouTube不断发展壮大,分析人士强调它是目前谷歌业务中最令人兴奋的部分之一。 Lorraine Twohill,首席营销官 Lorraine Twohill2003年加入谷歌,她是谷歌首个在美国以外招聘的营销人员,加入后迅速晋升至谷歌营销部门负责人。 她创建了谷歌内部广告公司创意实验室(Creative Lab) ,BI评论,她所负责的2020年超级碗谷歌广告,将谷歌人性化了。 新冠期间,Twohill与世界卫生组织和疾病控制与预防中心合作,在谷歌的产品中推广官方健康信息。 17人小组中,除了以上8位高管,还有负责教育产品和商务市场及谷歌生态等其他高管,他们和CEO皮采一道共同组成掌舵团队,保证谷歌这家市值1.3万亿美元,全职员工13.5万人的科技巨轮的航向。 
文章
SQL  ·  人工智能  ·  自动驾驶  ·  BI  ·  vr&ar  ·  云计算
2022-01-16
SpaceX新年「首发」成功!猎鹰9号将Turksat 5A卫星送入太空
美国东部时间晚上9点15分 ,一枚230英尺(70米)高的猎鹰9号火箭从卡纳维拉尔角空间站40号太空发射基地发射升空,将 Turksat 5A 号卫星送入太空。 但直播出现了一个短暂的延迟,SpaceX 公司在发射现场直播中说,短暂的视频延迟是由于下行跟踪问题。  据预测,发射的有利条件有70% 的可能性,主要担心的是积云和厚云,以及上层的风切变。对于旁观者来说,这些环境并不总是理想的,但是当猎鹰的咆哮声听起来特别响亮的时候,也会产生有趣的音响效果。 「猎鹰9号」的第50次飞行两级猎鹰9号火箭从发射台上跃出时,火箭的九个一级发动机的光芒把夜晚变成了白天。在火箭从视线中消失很久之后,引擎的隆隆声仍然可以听到。 这次的任务标志着今年在Cape的首次发射,发射后8.5分钟,火箭的第一级降落在 SpaceX 的两艘巨型无人驾驶船中的“Just Read the Instructions”上 。 今天的飞行是猎鹰9号第一级的第四次发射。这个被命名为 B1060的助推器曾在2020年6月为美国太空部队发射升级版的 GPS III 卫星,随后在9月和10月发射了 SpaceX 公司的 Starlink 互联网卫星。  猎鹰9号今天早上在发射台上垂直飞行。SpaceX并没有在飞行前对这种特殊的火箭进行静态点火试验。通常情况下,该公司会将火箭固定在发射台上,并简单地点燃其九个第一级发动机,以确保其系统在发射前按预期工作。但SpaceX跳过了这个例行测试。事实上,SpaceX在去年12月为美国美国国家侦察局空间站发射了一颗卫星的任务中也没有进行静态火力测试。 今年晚些时候,SpaceX 公司还将发射与之相对应的探测器Turksat 5B。这是土耳其扩大太空力量的一部分。  今年太空发射任务盘点除了 SpaceX 今天的发射以外,新的一年也有一些其他的太空发射任务,以下是一些值得关注的任务: Artemis 1 阿特米斯1号是NASA领导的国际阿特米斯计划的首次飞行,目的是在2024年前让宇航员重返月球。这将包括一个无人驾驶的猎户座航天器,被送往月球周围进行为期三周的飞行。它将到达距地球最大距离450,000公里的位置--这是任何能够运送人类的航天器飞入太空的最远距离。  阿特米斯1号将由NASA的空间发射系统发射进入地球轨道,这将是运行中最强大的火箭。猎户座从地球轨道起飞后,将由火箭的临时低温推进级推向另一条通往月球的道路。然后,猎户座太空舱将在欧洲航天局提供的服务舱的动力下驶向月球。 这次飞行任务将使地球上的工程师有机会评估该航天器在深空的运行情况,并作为以后载人登月任务的前奏。阿特米斯1号的发射目前定于2021年晚些时候进行。 Mars missions 今年2月,火星将迎来一批来自多个国家的地面机器人客人。阿拉伯联合酋长国的 "Al Amal "(希望号),这艘飞船是阿拉伯世界的第一个星际任务。  它计划于2月9日抵达火星轨道,将在那里用两年时间监测火星天气和消失的大气层。 天问1号 在 " Al Amal"号之后几周内到达的将是中国国家航天局的 "天问1号",它由一个轨道器和一个地面探测车组成。该航天器将进入火星轨道数月,然后将探测车部署到火星表面。如果成功,中国将成为第三个在火星上登陆的国家。这次任务有几个目标,包括绘制地表矿物成分图和寻找地下水。Chandrayaan-3 2021年3月,印度空间研究组织(ISRO)计划发射第三次月球任务:Chandrayaan-3。Chandrayaan-1号于2008年发射,是印度空间方案的首批重大任务之一。该任务由一个轨道器和一个表面穿透探测器组成,是首批确认月球存在水的证据的任务之一。  遗憾的是,不到一年后就失去了与该卫星的联系。可悲的是,它的后继者Chandrayaan-2号也发生了类似的事故,该卫星由一个轨道器、一个着陆器(Vikram)和一个月球车(Pragyan)组成。 Chandrayaan-3在几个月后宣布。它将只由一个着陆器和一个月球车组成,因为前一个任务的轨道器仍在运行并提供数据。 如果一切顺利,Chandrayaan-3号月球车将在月球南极的艾特肯盆地着陆。这里特别值得关注,因为它被认为拥有大量的地下水冰矿藏--这是未来任何可持续的月球居住的重要组成部分。 James Webb Space Telescope 詹姆斯-韦伯空间望远镜是哈勃空间望远镜的后继者,但其发射之路崎岖不平。韦伯望远镜最初计划于2007年发射,但在明显低估和超支后,与哈勃经历的情况类似,已晚了近14年,成本约为100亿美元(74亿英镑)。  哈勃在可见光和紫外光区域提供了一些令人惊叹的宇宙景观,而韦伯则计划将观测重点放在红外波段。这样做的原因是,在观测真正遥远的物体时,很可能会有气体云的阻挡。 这些气体云阻挡了真正的小波长的光,如X射线和紫外线,而较长波长的光,如红外、微波和射电则可以更容易地通过。所以通过在这些较长波长的观测,我们应该能看到更多的宇宙。 与哈勃的2.4米直径的镜子相比,韦伯还有一个更大的直径为6.5米的镜子--这对于提高图像分辨率和看清更精细的细节至关重要。 韦伯的主要任务是观察来自宇宙边缘星系的光,它可以告诉我们第一批恒星、星系和行星系统是如何形成的。这可能也包括一些关于生命起源的信息,因为韦伯正计划对系外行星大气层进行高细节成像,寻找生命的构件。 也许可能看到一些类似于哈勃望远镜拍摄的令人惊叹的图像。韦伯目前计划在10月31日搭乘 Ariane 5火箭发射。 此外,NASA还宣布,SpaceX 的龙飞船计划在1月11日从国际空间站返回地球。据悉,这是龙飞船首次执行商业货运飞船出坞操作,美国宇航员 Victor Glover 将在空间站负责监测工作。此次返回,龙飞船将携带5200磅的科学实验设备和其他物资。 动荡的2020年已然过去,2021年的征途,或许真的是星辰大海。
文章
编解码  ·  自动驾驶  ·  机器人  ·  定位技术
2022-01-15
2021,太空漫游
对于航天爱好者来说,2020年「可圈可点」。据统计,2020年全球共进行了114次航天发射任务,其中10次失败,发射成功率达92%。其中,NASA成功发射火星探测器,从2亿英里外的小行星上采集样本。SpaceX共进行25次发射,全部成功,入轨航天器854枚;其中还协助NASA两次将宇航员送入国际空间站。中国,北斗三号系统完成组网建设,新一代载人试验飞船,天问一号火星探测器 ,嫦娥五号探测器首次实现月球采样。人类太空漫游的速度在不断加快。经历了被压抑的2020年,随着各国慢慢「压平曲线」,恢复发展,我们有理由相信2021年太空漫游会给我们带来「更多惊喜」。新年看NASA活视频NASA刚刚发布了一个视频,我们来看一下NASA2021都有什么大动作↓视频介绍分五大板块——迈向月球、探索更远处、人类在太空、太空技术、开创性飞行,向我们概述了NASA在2021年的各项计划。其中,将第一个阿尔忒弥斯任务送上月球、毅力号登陆火星、詹姆斯·韦伯太望远镜发射尤为注目。2021,SPACEX依然看点很多有了前两次成功的合作,2021年,SpaceX还将继续和NASA合作,执行第二次任务,Crew-2。计划在2021年春天将4名宇航员送进太空,紧接着2021年秋还将进行Crew-3的发射任务。NASA的「外包业务」越做越顺手。如果一切顺利,NASA将继续与SpaceX的合作,这将填补美国航天计划中的一个重大空白,这个曾经充满活力的新兴项目将迎来成熟时刻。2021年,SpaceX 还计划为休斯顿的Axiom Space执行一项任务,把4个人送上太空,4人中,一名为NASA前宇航员,另外三名均为普通公民。SpaceX利用猎鹰9号火箭和龙飞船上的飞行人员只是其中的一部分。该公司继续测试其星际飞船航天器,下一代飞行器,看起来像一个飞行谷物筒仓,马斯克希望,有一天将载人飞往火星。NASA希望它能够成功。美国宇航局正在投资1.35亿美元建造星际飞船,作为宇航员重返月球计划的一部分。马斯克的时间表通常都是野心勃勃的,他说他希望太空船能够在2021年进入轨道。另外还有星链,2020年,SpaceX 已经发射了超过16批的卫星,并开始了网络公测。在获得美国联邦通信委员会(Federal Communications Commission)8.86亿美元的资助后,SpaceX 公司将从一家纯粹的火箭公司转型为互联网服务提供商。「村村通」就看星链了波音,2021年发射,不能再失败了2020年的大部分时间,波音公司都在努力修复其星际飞行器上的软件。2019年年底,波音公司进行了一次无人驾驶的试飞,一到太空就遇到了麻烦。今年三月底,波音公司将会重新进行无人宇宙飞船的发射。鉴于过去的问题,波音公司即将进行的试飞必须成功。该公司也和NASA签了合同,将宇航员送往空间站。但在美国航天局允许宇航员乘坐波音公司的飞船之前,该公司必须证明自己能够安全地独立飞行。鉴于之前两次致命的737 Max 飞机坠毁事故,造成346人死亡,所以下一次的发射不能再失败了。波音公司很清楚这一点,所以一直很谨慎。这次飞行的任务补丁被称为Orbital Flight Test-2(OFT-2),它有一个特殊的触摸功能——指纹图像。该公司在一份声明中表示: 「指纹触摸功能代表了那些每天在工厂里制造航天器的人,以及那些参与设计、测试、编码和培训的人,这样我们就可以正确制造 OFT-2。」。「从宏观层面来看,指纹功能是波音公司个性化理念的体现,就像载人航天一直以来并将永远是我们公司DNA 的一部分一样。」此次实验顺利,波音将进入下一步计划,与三名 NASA 宇航员一起执行测试任务,该任务可能在2021年底前完成。70岁的理查德 · 布兰森要去太空旅行了他乘坐热气球穿越了大西洋和太平洋,几乎死在爱尔兰海岸,还有一次计划飞往南加州的旅行中,在加拿大的北极地区坠毁。他打破了乘船最快横渡大西洋的记录,他曾经试图乘气球环游世界,却被困在了阿尔及利亚。2021年,70岁的理查德 · 布兰森可能面临他迄今为止最冒险的旅行: 乘坐亚轨道太空飞机去太空边缘旅行。自从2004年他创立「维珍银河」以来,这是他一直以来的追求。在经历了一次又一次的延误和挫折之后,公司急需接待乘客。它的运动型太空飞机已经两次进入太空,一次是和两名飞行员一起,另一次是和另外一名乘务员一起。去年12月,该公司的机载计算机监控火箭发动机连接中断后,被迫取消了试飞。维珍银河表示,将重复那次试飞,然后再飞一次,之后将轮到布兰森。如果一切顺利,维珍银河公司将把注意力转向飞行,几百人已购买了票价为25万美元的太空之旅。2021年,布兰森的另一项投资也会到达一个重要的里程碑。今年1月,其火箭公司维珍轨道公司(Virgin Orbit)计划再次进行LauncherOne火箭的试验飞行。几个月前,该公司的主引擎提前关闭,导致试验失败。2021年,杰夫 · 贝佐斯和他的「太空梦」2021年,对于杰夫·贝佐斯和他的Blue Origin公司来说也将会是突破性的一年。Blue Origin计划在未来的一年里在它的新谢巴德太空船上进行第一次载人飞行。就像维珍银河公司的太空船二号一样,它的设计目的是前往太空边缘,然后返回,而不是进入轨道。但与维珍不同的是,它还没有开始销售,也没有公布票价。Blue Origin还计划在2021年进行新格伦火箭的首次发射,这是由7个 BE-4发动机驱动的大型飞行器。今年早些时候,NASA 宣布新格伦火箭将有资格参与发射合同的投标,表明了对Blue Origin的信任。BE-4还将为波音公司和洛克希德 · 马丁公司的合资企业联合发射联盟正在设计的新型火箭提供动力。首席执行官托里 · 布鲁诺最近告诉记者,瓦肯半人马座火神计划在今年年底进行。这将是一个历史性的任务,作为NASA计划的一部分,它将携带由匹兹堡公司 Astrobotic 制造的机器人太空船登陆月球。如果成功的话,这将是自阿波罗时代以来从美国本土发射的第一个登陆月球的航天器。历数了这些发射计划,小编对未来的太空探索越来越期待,2021年,太空漫游还有很多看点,你期待吗?
文章
监控  ·  自动驾驶  ·  搜索推荐  ·  机器人  ·  测试技术  ·  定位技术
2022-01-15
【Dailyio 年终巨献】万字长文读懂 2020 全球 AI 领域的十大关键词
地缘政治下的 AI相比于疫情,人类不同群体之间的利益冲突,显然更具破坏性。香港国安法正式施行后,2020 年中美互联网公司在香港运营模式也在发生变化。微软[53]、Google、Facebook、Twitter 相继宣布不再回应来自香港当局的数据访问请求。与此同时,短视频应用 TikTok 也宣布退出[55]香港市场。在人工智能领域,中美欧(盟)之间进入到一个新的博弈阶段,这其中,「限制技术出口」成为关键词。随着第十三届全国人民代表大会常务委员会第二十二次会议通过《出口管制法》,人大常委会法工委经济法室主任王瑞贺说了这样一番话:「除传统的军民两用物项、军品、核外,还参考对外贸易分类标准,将其他与维护国家安全和利益、履行防扩散等国际义务相关的『货物、技术、服务等』均纳入管制物项」。结合此前中国商务部与科技部联合发布的新版《中国禁止出口限制出口技术目录》,已覆盖语音、图像、人机交互等几乎主要的人工智能技术领域,这也意味着,如果按照这样的规定,中国各色人工智能企业以及各种标榜人工智能的产品,必须考虑如何进入「内循环」的发展阶段。在欧洲,欧盟委员会也计划推出一项技术出口管制清单,旨在限制各成员国对于包括间谍软件、面部识别这类「两用型」技术的出口。当下对中国人工智能发展状况的解读,往往被放在中美技术对抗的大环境下,很多分析充满了冷战思维,因此需要首先破除对于中国人工智能产业之上的「神秘色彩」,比如海外经常提及的中国 2017 年开始部署 AI 国家战略就是一个误读,2017 年发布的「新一代人工智能发展规划的通知」,更像是一个对此前各地方政府相关工作的认可,并从国家政策层面予以更多的支持。其次,对于中国 AI 实力的描述,一定要放在特定的场景或条件下讨论,比如,如果讨论学术论文,那么需要看到中国 AI 学术论文数量增长并成为世界第一背后的论文质量,任何把一个宏大命题简单化的做法都是不理智的,更何况很多时候「人工智能」像是一个「麻袋」,里面装满了各式各样的技术。还有一些美国媒体热衷于把国家间的 AI 竞争描述为「AI 军备竞赛」,且不说「军备竞赛」的说法是否合适,有一个显而易见的问题:如何衡量国家的 AI 能力优劣?知名智库 Tortoise 通过一份全球 AI 国家指数给出了可能的理解角度,从实践、创新与投资三个方面梳理了全球主要国家的 AI 能力,总体上看,美国、中国、英国、加拿大、以色列位列前五,如下图:半导体之大变局2020 年的半导体领域迎来诸多新变化,地缘政治催生的中国半导体「自给自足」趋势与产业「分久必合」的背景遥相呼应,与此同时,机器学习的巨大算力需求,也在刺激专属芯片的快速发展。就在刚刚过去的这个周末,美国商务部将中芯国际列入贸易实体清单,这也为 2020 年中美半导体技术封锁与反制画上了一个休止符,整个 2020 年,中国各地注册成为半导体的公司数量激增,下图是 FT 根据企查查的数据整理而成。与此同时,伴随着中国首个芯片大学南京集成电路大学成立与集成电路或纳入「十四五」国家专项规划同时呈现的,还有一大批上一次「半导体热潮」留下的烂尾项目,无论是位于武汉市东西湖的弘芯还是位于陕西西咸新区的坤同半导体,过去几年大量低水平重复建设的项目,所谓产业发展变成了投资变现,而无论是技术研发、知识产权还是人才培养,过去几年的发展几乎可以忽略不计。与过往的半导体热潮不同,此次中国半导体行业发展的每一个细节,都被放在了中美技术对抗的聚光灯下,被全球各个媒体/智库分析解读,或也是各地政府重要的「政治任务」。在这样的背景下,一些客观存在的事实逐渐失真,比如中国大陆半导体产业的行业位置,德勤的一份报告给出的以下一组数字:而亚洲地区前十大半导体公司,只有两家中国大陆公司入围,这两家公司也是大家熟悉的(华为)海思和中芯国际。其次,根据多个数据源的统计,未来十年亚洲地区的半导体产业,特别是中国,将迎来巨大发展。与地缘政治影响下的半导体发展态势相呼应,2020 年的全球产业格局,进入到一个「分久必合」的新阶段,过去这一年,已经有四起超过 100 亿美元的并购:7 月,Analog Devices 209 亿美元收购 Maxim;9 月,英伟达 400 亿美元收购[69] ARM;10 月,AMD 350 亿元收购 Xilinx,Marvell 即将以约 100 亿美元收购模拟芯片及光学芯片厂商 Inphi;事实上,早在今年 9 月,半导体领域的并购金额已经成为过去七年里第二高的年份,现在计算一下,2020 年已经第一了。这些动辄百亿美元的并购,也将半导体行业推入赢家通吃的新阶段,由于研发费用的不断上涨以及快速变化的市场趋势,这个领域传统意义上的增长基本停滞,并购成为巨头们全新的增长方式,包括英伟达、AMD 在内的巨头通过收购扩大自身产品线,快速构建更具覆盖性的产品组合,满足不同客户的需求。具体到英伟达收购 ARM 的案例里,还有一个非常奇特的景象。ARM 的特殊性——几乎所有的英伟达竞争对手都需要 ARM——使得即便是英伟达的竞争对手,站在行业发展的角度,也「真心希望」英伟达可以尽快完成收购并实现更好的产品整合,而在公司竞争的角度去看,整个半导体行业都不想看到这笔交易可以成功,这必然将造成英伟达一家独大的行业地位,进一步挤压其他竞争对手的生存空间。但也需要注意一点,随着地缘政治越发影响到科技行业,半导体领域的并购显然已经被纳入到国家竞争的重要环节,2016 年,高通宣布以 440 亿美元收购荷兰公司恩智浦,但中国监管部门并没有批准该交易,最终也使得这笔巨额收购不了了之,而在 2020 这个特殊年份,英伟达、AMD、Marvell 的收购能否成功,明后两年才会见分晓。理解半导体产业变局的另一个维度是 AI 芯片的崛起。过去几年人工智能的高速发展,催生了巨大的算力需求。结合 OpenAI 此前的报告,业界最领先的 AI 模型,对于算力的需求几乎每 3.4 个月翻一倍,作为对比,摩尔定律「规定」的 CPU 算力增长速度为每两年增长一倍。这意味着,如果要训练高质量的机器学习模型,无论是采购英伟达 GPU 还是租用云服务商的 GPU/TPU 计算实例,都需要花费大量的金钱,这对很多科研院所以及学校来说都是一个天文数字。在最近发布的一份报告里,MIT 的研究者们指出,如果无法在算力上实现新的突破,那么当下包括自动驾驶、翻译、计算机视觉等技术的落地将受到重要影响。为 AI 计算提供专属芯片无疑是潜在的解决方案,如何理解通过专属 AI 芯片来处理 AI 需求,兴瀚资本创始人杨歌说过这么一番话:目前人工智能芯片和边缘计算的基础还不是非常成熟,在不成熟的基础上做软件、场景、算法或应用,就相当于在不成熟的地基上搭建空中楼阁。这就像是最早在移动梦网上开发游戏和软件的公司,因为移动梦网的底层不行,最后这些公司都会死掉,会被移动互联网所取代。目前的情况是,所谓 AI 芯片并没有专属定义,既有 GPU,也有 IPU,还有 TPU、FPGA 等等,全球范围内,从巨头到创业公司,都在挤入这个领域。这其中,英伟达又是最具代表性的公司,过去的 2020 年,英伟达发布基于 7 纳米工艺、采用全新安培架构的 A100 系列 GPU,持续引领数据中心的 AI 模型训练与部署。英伟达在 GPU 产品的研发速度也在创造一个新的定律,《华尔街日报[76]》称之为「黄仁勋定律」(黄是英伟达创始人)。如果你知道此前「摩尔定律」定义了过去 50 多年的计算能力发展轨迹,那么也应该理解这个定律的潜在价值,特别是在当下算力成为困扰 AI (主要是深度学习)发展障碍的大背景下,英伟达对于算力的探索对于整个行业意义重大。与此同时,英伟达的大客户们——AWS、阿里巴巴、百度——也在加速自研 AI 芯片的进程。本月初的 re:Invent 大会上,AWS 发布面向机器学习训练场景的自研芯片 Trainium,官方表示其性能可以提升 30%,同时能将成本节约 45%,这个对比对象就是英伟达;而在上周,百度 CTO 王海峰也透露,该公司自主研发的云端 AI 通用芯片百度昆仑1,已实现量产和应用部署,同时下一代芯片也将在 2021 年上半年实现量产。无论国内还是国外,AI 芯片的竞争还处在非常早期的阶段,在中国,阿里巴巴、腾讯已经虎视眈眈,国家战略与各地政策的推动,使得各色 AI 芯片创业公司不断「亮相」,比如睿思芯科、知存科技等,这些公司的主要资本推手里,不乏地方政府的影子,接下来的研发、部署与应用,还有诸多看点。「越大越好」的机器学习模型OpenAI 今年发布的超大语言模型 GPT-3 引发众多关注。根据其论文透露的信息,这个模型拥有 1750 亿参数,超过此前微软图灵-NLG的 170 亿参数的规模,成为目前最大规模的语言模型。或许规模并不是一切,但当如此大规模的模型被应用到某些场景的时候,开始出现了一些新的变化。一位开发者将「图灵测试」应用到 GPT-3 的模型里,其中有个细节让我印象深刻,开发者设计了一组美国建国前的总统是谁的问题,如下图所示:这明显是一个不可能有答案的问题,但 GPT-3 还是给出了一组答案,这些美国「总统」,又是当时对于美国政治产生重要影响的人物,换句话说,这些人的确可能成为美国总统。另一个开发者则将 GPT-3 应用到写作场景里,如下图所示,人类写了几行话之后,剩下的就交给了 GPT-3 来生成。还有一个围绕医疗场景构建问答的尝试,结果其实也在意料之中,很多测试结果非常正确,但一些测试结果「非常错误」,这在医疗领域是无法容忍的结果,同时测试者也无从知晓为何会有这样错误的答案。但所有围绕 GPT-3 的狂欢都无法忽略一点:GPT-3 与真正意义的智能无关。一方面,这又是一个堆积硬件与参数的胜利,其研究架构本质上没有脱离上一代 GPT-2 的架构(相关对比);另一方面,与其他模型相比,GPT-3 的潜在问题与挑战一点也不少(比如数据偏见),但不管是 OpenAI 还是一些开发者,都有意无意将这些问题忽略掉,这才是最大的问题。GPT-3 的第二个争议则是为微软开辟了独家渠道。在 2020 年 9 月的一项合作协议[88]里,微软成为除 Open AI 之外唯一一家可以获取 GPT-3 源代码的科技公司,正如《MIT 科技评论》一篇文章所言,Open AI 原本可以为人类谋福祉,但现在,它只会让全球最有钱的一家公司获益。微软与 Open AI 的合作始于 2019 年 7 月,微软当时宣布 10 亿美元投资这家公司,我在当时的会员通讯里分析过微软的动机:微软很缺一个对标 DeepMind(Google 旗下)的机构。坦率来说,微软的基础研究能力一点也不弱,其 AI 基础研究的机构和部分也是业内公认的「黄埔军校」。但微软的这些机构,包括微软研究院、微软亚洲研究院的研究成果基本局限在行业内的宣传,与 DeepMind 围棋 AI 横扫全球公共讨论有着巨大的差距,而 OpenAI 在这个领域拥有丰富的经验,此前他们对于 GPT-2 模型的舆论宣传,可谓相当到位。相对于去年的 GPT-2,今年 GPT-3 的影响力更大,这也让微软去年的这份赌注增值不少,从而也给今年的「独家授权」做了做好的注脚。但另一方面,微软获得独家授权的事实让所谓「AI 民主化」的宣传彻底成为一个口号。GPT-3 这样一个超大规模语言模型的复杂度、所消耗的资金,远非一般公司、研究机构所能承担,在此前的模式里,尽管 Open AI 没有公开源代码,但开发者、小公司、研究机构依然可以将 Open AI 作为一家中立机构,通过调取 API 的形式做一些研究和开发,这是典型的「AI 民主化」实践,如今,当微软成为 GPT-3 背后的巨头,这个超大语言模型的中立性已经不复存在,在一个既当运动员又当裁判员的赛场上,微软要和不同领域的开发者、研究者一起「竞技」。作为 Open AI 前创始人,伊隆·马斯克在社交媒体的这句话或许是一个预言:(这个合作)就是开放的对立面,Open AI 已经成为微软的俘虏。GPT-3 带给行业的第三个影响,是不断验证「模型越大性能越好」的行业规律。在由两位英国投资人 Ian Hogarth、Nathan Benaich 制作的 AI 行业报告「State of AI[92]」里,「big-model world」已然成为行业方向:Google 今年也有两个超大规模机器学习模型,「Multilingual T5」是一个超大规模跨语言的文本 transformer 模型,这个模型在一个支持 101 种语言的数据集上进行预训练,目前拥有 130 亿参数,在多个测试基准种有较好的表现;「Conformer[94]」则是一个超大规模语音模型,该模型在语音测试的单词错误率环节仅有 1.4% 错误率,整个模型的参数高达 10 亿个,研究者使用 3 万多个小时的音频数据进行预训练,整个预训练过程持续 4 天,借助 512 个 Google Cloud 的 TPU V3 超强算力完成。上述这些模型的确展示出一种趋势:通过超大规模的参数以及巨大的算力,有望在语音、文本与图像领域实现新的技术突破。从模型最后的表现来看,「越大越好」的结论的确成立,但也带来一系列更大的问题:这些模型既是「烧钱机器」也是「能源消耗机器」,如下图所示。更进一步,超大规模的模型与巨大算力的需求,凸显出机器学习领域开始被「安迪比尔规律」左右,一如当年 PC 时代的英特尔处理器与微软操作系统之间的互动一样,机器学习的硬件突破,特别是计算能力的突破,很快就被更大规模的模型所消耗,从而推动计算硬件进入下一个发展周期。但显而易见的分裂也在这个领域出现:一方面学术领域热衷超大规模机器学习模型的研发,另一方面,工业领域的机器学习应用,却在不断探索模型缩小、剪切的可能性,所谓「Too big to deploy」就是这个道理。AI 的「秋天」在经历了一轮又一轮的巨额融资后,2020 年的 AI 创业公司们进入到一个实实在在的生意场。站在一个生意的角度去看,AI 创业公司需要应对三大挑战:云服务成本、人类的位置与成本以及 AI 领域的「长尾效应」。这其中,云服务成本最值得警惕。云服务的确可以帮助 AI 创业公司快速完成机器学习模型的搭建与部署。但也隐藏了众多「套路」,比如,整个机器学习模型训练所需的计算、存储、网络资源非常高,这也是一个巨大成本,FT此前的一篇报道称,创业公司在云上的花费,为 AWS、微软贡献了巨额收入。与此同时,云服务的隐形成本还包括机器学习模型在云服务商不同区域的迁移,以及在不同云服务商之间的迁移等等。更重要的一点还在于,困扰整个 AI 发展的算力问题,短期来看几乎只能靠钱来解决,摩尔定律已经失效,而 OpenAI 指出的巨大算力需求与英伟达单个 GPU 实际算力提升之间形成了鲜明的反差。或许会有人说,分布式计算就是为了解决这个难题而出现的,不过正如投资公司 a16z分析师所言,这个方案解决的是速度,而不是成本。创业公司对于分布式计算的迷恋,无异于「财务自杀」。另一个不能忽视的成本就是人力成本。过去几年时间里,媒体热衷于报道哪家公司年薪百万招募机器学习博士,但很少听到哪家 AI 公司为获得人类标注数据所付出的成本,a16z 给出的数字显示,这部分成本占据了企业营收的 10%--15%。最新的一个佐证是,在被誉为中国 AI 明星创业公司旷视科技的招股说明书里,「数据标注」人员占公司全员的比例为 17%。这也可以解释为何数据标注已然成为一个巨大的产业,利用中国天然的劳动力优势,中国数据标注产业的发展势头也非常凶猛。第三个潜在挑战,AI 创业领域的长尾效应会「杀死」创业公司。机器学习/深度学习与软件工程一样,都是需要迭代与实验,但与软件工程不同,整个人工智能更侧重实验,也就是说,需要不断测试模型在新数据上表现,然后不断重复。如果创业者花大量时间去调整模型的参数,很容易进入到长尾分布的「尾」,即便你的模型足够好用,但因为其客户群体过小/需求过于分散,也无法支撑其未来的业务发展。投资公司 a16z为此提出了几个建议,比如通过整合数据管道降低数据成本,利用构建自己的基础设施平台减少对于云服务的需求,这两个方面可以为 AI 创业公司节约大量资金,剩下的就是进一步压缩机器学习模型,并在不断训练中提升模型精度。如果说 AI 创业公司的价值会通过所谓估值来体现,那么在更大的层面,作为行业观察者,或者作为普通读者,又该如何衡量一家 AI 创业公司的价值呢?我个人提出了三个判断角度:关注这些产品背后的具体技术,到底是机器学习?深度学习?还是监督(非监督)学习?越具体的技术越能体现其价值;一家 AI 创业公司的竞争优势在于技术是否领先以及对于行业的认识,前者看论文,后者侧重场景;在 2C 与 2B 中选择 2B,一个案例,「AI 换脸」作为 2C 产品,其价值以及估值局限在社交产品领域,而在后端提供「AI 换脸」技术的 2B 创业公司,比如商汤,则可以称之为「图像领域的 AWS」(技术基础设施提供商),价值与估值显然不同。尽管在 2020 年已经有大量 AI 公司完成或正在完成 IPO,但在另一个维度去看,被收购或许也是 AI 创业公司的最好归宿,Bloomberg发现,科技巨头一直没有放松对于 AI 创业公司的收割,而创业公司与投资人也乐于这么做。Bloomberg 援引 CB Inishgts 的一组数据显示,仅在 2019 年,就有 231 家创业公司被收购,而在 2014 年,这个数字仅为 42 家。过去的 2020 年,苹果继续在 AI 领域买买买。公开资料显示,苹果在 2020 年先后收购了机器学习创业公司 Inductiv、计算机视觉公司 Vilynx,前者可以有效提升机器学习模型的数据「纯净度」,后者主要提供计算机视觉与内容识别技术,或为苹果正在秘密研发的「苹果搜索」增加更多技术支撑。五年多的时间里,苹果已经在 AI 领域收购了多家明星创业公司:2015 年,收购图像 AI 创业公司 Perceptioin;2016 年,收购机器学习(偏预测分析与推荐引擎)创业公司 Turi 以及印度创业公司 Tuplejump;2017 年,收购德国的眼球追踪创业公司 SensoMotoric;2019 年,收购内容发现创业公司 Laserlike;根据苹果一贯以来的收购策略,当一家创业公司被收购后,苹果会将其关闭,所有技术和人员整合到苹果现有部门里,所有技术也都将以产品化的形式展现出来,这也是苹果特有的机器学习战略。从 AI 创业公司面临的挑战到中国多家 AI 创业公司 IPO 后的表现,当下很多 AI 创业公司更像是一个服务公司而不是软件公司,换句话说,「你可以代替某些服务公司,但无法代替服务」。这意味着,当 AI 创业公司以服务公司做对标的时候,AI 创业公司的估值与增长空间已经被限定,至少在硅谷,软件/技术公司的估值为其营收的 10-20 倍,而服务类公司只是 2 倍。这也抛出了另一个问题:是不是即将迎来又一个「AI 冬天」?我的结论与今年 6 月出版的《经济学人》判断一致,这个时期更像是「秋天」,无论资本市场还是国内外的巨头公司,正在更理性地看待 AI 技术与产品,同时也在评估其对于未来行业发展的影响。所有这一切都在展现一个事实:AI 创业公司的热潮已经过去了。失望的自动驾驶2020 年的自动驾驶继续延续着前几年「小步快走」的节奏,在全球疫情的持续影响下,这个行业正发生一系列深刻变化。其一,资本集中。Alphabet 旗下的 Waymo 可以在 60 天内获得两笔[106]共计 30 亿美元的融资,除了彰显出资本市场对于 Waymo 的持续看好,更凸显了资本向头部公司倾斜的趋势,市场对于自动驾驶、AI 等技术的部署难度已经有了更清晰的认知,从而也促使他们减少对于创业公司的巨额投入,转而支持已经成为巨头的所谓「创业公司」。与 Waymo 以及再获软银融资的滴滴自动驾驶业务形成鲜明对比的,还有自动驾驶卡车创业公司 Starsky Robitics 关闭的消息。其二,并购重组加速。亚马逊正式收购Zoox ,收购后的 Zoox 继续保持独立运营,这笔传闻12 亿美元的收购,展现了亚马逊对于自动驾驶的野心。Uber 也在年底将旗下的自动驾驶业务出售给另一家自动驾驶公司 Aurora,交易细节显示,Uber 不仅将旗下 1200 名员工「转移」到 Aurora,还会向该公司投资 4 亿美元,同时两家公司建立战略合作伙伴关系。尽管 Uber CEO Dara Khosrowshahi 表示,未来几年将让 Aurora 自动驾驶车辆进入 Uber 平台,不过这个表态有太多自我安慰的意味,持续的烧钱投入与无法短期突破的技术,成为摆在 Uber 以及整个自动驾驶行业的难题。其三,车厂与自动驾驶供应商结盟。福特与英特尔旗下 Mobileye 合作、大众旗下的卡车公司 Navistar 与自动驾驶公司图森合作、克莱斯勒与 Waymo 合作、戴姆勒与芯片巨头英伟达合作,所有这些「车企+技术公司」的合作形成一个个利益体,比如当 Waymo 与克莱斯勒签署一份排他性协议的时候,原来与克莱斯勒合作的 Aurora 也失去了一个大客户。其四,自动驾驶车辆上路。当 Waymo 等多家自动驾驶公司扎堆凤凰城的时候,一大批中国的公司也在中国各地开启了自动驾驶出租车业务。6 月, 滴滴在上海开放自动驾驶试乘体验,到 10 月的时候,百度 Apollo Go 已先后在长沙、沧州、北京试点自动驾驶出租业务。从媒体的评测来看,目前的这些自动驾驶出租车更像是「一辆特定区域内的区间摆渡车」。但需要看到的是,自动驾驶的现状远不能满足用户与市场的期许,而包括百度在内的公司有意无意地释放出类似「自动驾驶出行即将改变彻底世界」的营销口号,势必进一步扩大自动驾驶理想与用户现实体验之间的鸿沟,这对整个行业的健康持续发展并不是一件好事。更重要的一点,无论是 Waymo 还是百度、滴滴,其商业模式不过是自动驾驶发展路线的一种,就在社交媒体不久前广泛讨论 Waymo 将如何影响自动驾驶发展的时候,伊隆·马斯克发推说道:Waymo is impressive, but a highly specialized solution. The Tesla approach is a general solution. The latest build is capable of zero intervention drives. Will release limited beta in a few weeks.2021 年的自动驾驶或许还将伴随着失望与惊喜的情绪,但在众多「寻找中国特斯拉」的资本助推下,新能源汽车或未来汽车、自动驾驶之间的结合,还会持续推动行业进入到一个新阶段。尾巴:没有预测到这里,我用 13000 多字回顾了一段属于 2020 年的历史,在此前的任何一个年末,或许可以从有章可循的技术发展与可追踪线索的产业变化里预测接下来的一年,但经历过这一年后,任何看似理性的预测都显得极其愚蠢。尽管 AI、云等技术的确深刻影响行业变革与经济发展,但疫情、地缘政治为所有的生意投下了巨大的不确定阴影,所谓的「新常态」,也是在诸多不确定性中寻觅一点点确定的事情,至少目前来看,唯一可以确定预测的事情就是:整个世界再也无法回到疫情之前的样子。一百年前的 1920 年,一战与「西班牙流感」冲击了整个世界,这一年当选美国总统的 Warren Harding创造了一个词「Normalcy」,他希望人们忘记战争与疫情的痛苦,回到「常态」,后面的故事里,1920 年代的世界,就像脱缰的野马,它没有回到任何一个过往「常态」,而是进入到另一个艺术、工业发展的「黄金时代」。那么 2020 年代呢?
文章
机器学习/深度学习  ·  人工智能  ·  分布式计算  ·  自动驾驶  ·  数据处理  ·  芯片  ·  开发者  ·  计算机视觉  ·  异构计算  ·  AI芯片
2022-01-15
2021百万年薪AI职位趋势:数据科学、Python、自动驾驶、AIOps你关注了么?
毫无疑问,今年,人工智能一直是个流行语。它已被确立为新兴技术(例如大数据,机器人技术和物联网)的主要驱动力。那么,未来12个月的AI将会如何?         如果2021年的你想进行一些职位调整,或正在瞻望新的发展机遇,不妨一看。技术类人才需求仍在上涨,2020年收购体现人才争夺战未来,IT相关招聘将在许多方面进行,而且会更加细化。让我们先来看一组数据。在美国等发达国家,截至2020年第三季度,技术专业人员的失业率(3.5%)低于平均水平,许多大型组织都希望填补更多的技术职位。据权威机构Dice称,在排名前50位的技术雇主中,超过三分之二(68%)的职位发布数量超过第二季度 。另外除了网络安全和云之外,一些更专门的角色变得越来越有价值。数据科学家和Python开发人员在2020年后期看到了需求的增长(流行前增长最快的两个行业),这表明公司可能会像往常一样恢复业务,并重新关注数据分析和软件构建,这对整体业务战略至关重要。可以说,技术人才不仅没有出现饱和,反而,科技企业对其需求增加了。这一点,我们从2020年几大重要并购案中可以窥见。自动驾驶领域人工智能专家自动驾驶汽车是许多大型科技公司关注的主要领域。除了该领域的龙头,谷歌的姊妹公司Waymo,苹果也正在加大其无人驾驶汽车计划;亚马逊此前也已经投资了自动驾驶汽车初创公司Aurora以及电动卡车公司Rivian。美国自动驾驶领域的人才数量基本是中国的 10 倍左右。在美国大型科技公司或者是车厂,一个自动驾驶部门有 1000-2000 人很常见。目前,中国也在此领域加大力度发展,因此,2021年,自动驾驶领域的人才力度将会加大。具有战略意识的软件开发人员和管理人员AI 专家在领英统计的美国排名前 15 位的新兴职位中,年招聘增长率为 74%。AI 专家被需要的原因包括:AI 在推动数据驱动决策、降低风险方面的作用;企业需要一种有效的方式扩展其 AI 实践;组织面临工作流程优化的压力,因此越来越多的企业要求 BI 团队开发和管理 AI/ML 模型。但与此同时,软件开发人员和管理人员也正逐渐成为数字时代的MVP。Robert Half Technology的《 2021年薪资指南》指出:「公司正在寻求各种类型的开发人员来创建新的应用程序和软件服务,以支持业务,进而提供竞争优势 。」根据Dice对工作清单的分析,随着2020年即将结束,Python开发人员,软件开发经理,后端和前端开发人员以及数据仓库开发人员的需求都更高。              鉴于这些角色以及其他类似的开发人员和经理角色背后的势头,雇主似乎很可能会在2021年之前继续招聘这些角色。新一代具有战略眼光的开发人员正在涌现,这些开发人员将推动创新并成为公司技术部门中最具影响力的人。专注于业务的数据科学家,年薪百万的最佳实践者越来越多的公司意识到,扎实地掌握其数据和洞察力是生存的关键。招聘人员正在寻找可以收集,清理,存储和分析重要数据集的分析师和科学家。随着数据生态系统的复杂性增加以及公司扩展其智能自动化的实施,对数据科学,数据分析和报告技能的需求可能仍然很重要。但是,IT领导者将看到,虽然统计理论和诸如AI之类的技术的科学技能至关重要,但业务敏锐度也很重要。Google作为科技领域的老大哥,其对数据的嗅觉还是十分敏感的。早在一月份,Google宣布将购买无代码应用开发平台AppSheet,该平台可帮助企业创建与其核心业务数据相关的应用。AppSheet还附带了许多AI智能设备,包括光学字符识别(OCR),预测建模和自然语言处理(NLP),以加快数据输入并找出用户想要构建哪种类型的应用程序。谷歌表示,仍可作为独立产品使用的AppSheet将「补充其重新构想应用程序开发空间的战略」,并将集成到Google Cloud中。该职位将需要通过对大型,高维数据集进行探索性数据分析来开发创新解决方案,以解决业务问题;在相关数据挖掘算法的帮助下,根据实际和测试数据集创建复杂的实际分析数据模型;并运用统计知识,机器学习,数据建模和模拟知识来识别模式,识别机会,提出业务问题并产生见解。数据工程师是个人,他们捕获原始数据,有时对其进行清理,分类,然后将其提供给数据科学家,然后再构建AI模型。全球各国数据科学家薪资中位数确实,数据工程师在LinkedIn的新兴职位列表中名列第八,自2015年以来,其每年的雇用增长率为35%。LinkedIn指出,从零售到汽车的行业正在「抢夺这一难以招聘的人才。」数据科学家职级的薪水对比 AIOps分析师,工程师和架构师AIOps优化将是2021年的首要任务 。更多的IT部门正在探索用于IT运营(AIOps)的人工智能,以管理对其基础架构团队不断增长的需求。AIOps工程师们的薪资发展趋势:机器人流程自动化(RPA)领域机器人流程自动化(Robotic process automation)简称RPA,是以软件机器人及人工智能(AI)为基础的业务过程自动化科技。2020年,微软抛出了一个讯号:收购Softomotive,一家2005年在伦敦成立的RPA公司。严格来说,Softomotive不是一家AI公司,但是RPA与AI紧密相关,因为它可以帮助企业自动化重复流程,尽管具有结构化的输入和逻辑。RPA是一个价值20亿美元的行业,微软已经在其Power Automate平台中提供了一些RPA工具和技术,这就是为什么它在今年早些时候以未公开的价格收购了伦敦的Softomotive的原因。微软表示,将在Power Automate中添加Softomotive的桌面自动化工具,并以「价格合理的价格」向企业客户提供该工具。目前,Softomotive仍可作为独立产品使用。该领域职级与薪资对比:NLP智能语音领域今年,苹果公司收购语音助手Voysis,一家2012年成立于都柏林的公司,该公司建立了可以直接在移动设备上运行的自然语言和对话界面,并且特别着重于支持「品牌与用户之间丰富的自然语言互动」。新的一年,NLP也将成为AI中最强劲的发展领域。多年来,Big Tech一直通过产品和收购来培养顶级技术人才,这已不是什么秘密,但这或许会给我们带来明年的求职启示。
文章
人工智能  ·  自然语言处理  ·  自动驾驶  ·  前端开发  ·  架构师  ·  机器人  ·  数据挖掘  ·  BI  ·  网络安全  ·  Python
2022-01-15
马斯克:特斯拉自动驾驶软件FSD涨价,1.2万美元一套
​马斯克曾说过,特斯拉的自动驾驶技术 FSD 最终价格可能会超过 10 万美元,过去一段时间里特斯拉在不断接近这个目标。周六上午,特斯拉 CEO 伊隆 · 马斯克宣布旗下电动车「全自动驾驶 FSD」软件在美国的价格将在 1 月 17 日提升到 12000 美元。和往常一样,马斯克在推特上「官宣」了特斯拉最新的决定,并表示随着特斯拉接近 FSD 量产版代码的发布,FSD 价格将会继续上涨。据马斯克介绍,该公司还将提高 FSD 按月订阅的价格,目前大多数用户的每月费用为 199 美元,但马斯克没有具体说明价格。自特斯拉在 2020 年 10 月将 FSD 价格从 8000 美元上调至 10000 美元以来,本次的再次涨价让后来者更加需要仔细掂量自动驾驶值不值了。不过对于国内而言,Model 3 「完全自动驾驶能力」的选装包近一年来的价格一直维持在 64000 元未变。特斯拉一直在扩大其 FSD 软件测试版本的覆盖面积,这是一种业界领先的辅助驾驶系统,不仅可以自动变换车道、跟车,还可以实现城市路况的自动驾驶,但这些功能时常会引发人们的担忧。自 2019 年起,特斯拉的「全自动驾驶」(FSD)的 Autopilot 更新 Beta 版开始向一小部分用户推出,车主可通过 OTA 方式下载到最新 FSD beta 版软件。随着内测范围的扩大,该系统成为了人们热烈讨论的话题。​特斯拉在其官网上表示,自动驾驶功能包括但不限于自动紧急制动、前方碰撞警告、车道保持和自适应巡航控制,这些功能基本上可以使汽车速度与周围交通的环境相匹配。全自动驾驶 FSD 则是一个高级可选套件,包括更复杂的自动驾驶能力,如自动变道、交通信号灯、停车标志识别和城市街道自动辅助驾驶能力。尽管名为全自动驾驶,但如今它的正式版仍不允许汽车在没有驾驶员干预的情况下自动驾驶。特斯拉专门提到,FSD 车辆尚未实现完全自动驾驶,目前可用的功能仍需要驾驶员主动进行监控。上述功能的激活与使用将需要数十亿英里的行驶里程验证,以达到「远超人类驾驶员的可靠性」。同时最终正式版的应用还需要经过政府部门的许可。只有收到邀请、购买或订阅 FSD 并在特斯拉「安全评分」测试中获得高分的司机才能访问 FSD Beta。进入后,车主可以实际测试当前处于未完成状态的功能,例如城市环境中的自动驾驶。马斯克在周五的一条推文中表示,下一个更新版 FSD Beta 10.9 即将完成。除了 FSD 之外,特斯拉的增强版自动辅助驾驶功能以 Autopilot 的形式进行销售,可以实现高速公路环境下的辅助驾驶,在其所有车型(Model S、X、Y 和 3)上均可选配。​尽管看来会是一个显著的收益增长点,但特斯拉并未在其收益报告中准确披露每个季度有多少客户预先为 FSD 付费或订阅 FSD。因此,目前尚不清楚美国的价格上涨会在多大程度上提高其未来的利润率。根据一项调查,大约 11% 的特斯拉车主在买车时选配了 FSD 功能。特斯拉 FSD 的实际道路「付费测试」引发了美国监管部门的关注,加州机动车辆管理局(California DMV)和国家公路交通安全管理局(NHTSA)正在调查特斯拉 FSD 开发和技术的不同方面。特斯拉已告诉两家机构,其技术只是「Level 2」级自动驾驶系统。根据 DMV 的定义,「2 级系统可以提高安全性或提供驾驶员辅助,但如果没有人的主动物理控制或监控,则无法驾驶或操作车辆。」​但马斯克暗示该公司的技术比 Level 2 更先进。在 2021 年 12 月 28 日发表的采访中,YouTube 主播 Lex Fridman 询问马斯克,「你认为特斯拉什么时候可以实现 Level 4 级的 FSD?」马斯克回答说:「看起来很有可能是明年。」
文章
监控  ·  自动驾驶  ·  安全  ·  测试技术
2022-01-14
CPU是什么?GPU是什么?有图有真相(3)
从架构图我们就能很明显的看出,GPU的构成相对简单,有数量众多的计算单元和超长的流水线,特别适合处理大量的类型统一的数据。但GPU无法单独工作,必须由CPU进行控制调用才能工作。CPU可单独作用,处理复杂的逻辑运算和不同的数据类型,但当需要大量的处理类型统一的数据时,则可调用GPU进行并行计算。注:GPU中有很多的运算器ALU和很少的缓存cache,缓存的目的不是保存后面需要访问的数据的,这点和CPU不同,而是为线程thread提高服务的。如果有很多线程需要访问同一个相同的数据,缓存会合并这些访问,然后再去访问dram。GPU的工作大部分都计算量大,但没什么技术含量,而且要重复很多很多次。借用知乎上某大神的说法,就像你有个工作需要计算几亿次一百以内加减乘除一样,最好的办法就是雇上几十个小学生一起算,一人算一部分,反正这些计算也没什么技术含量,纯粹体力活而已;而CPU就像老教授,积分微分都会算,就是工资高,一个老教授资顶二十个小学生,你要是富士康你雇哪个?GPU就是用很多简单的计算单元去完成大量的计算任务,纯粹的人海战术。这种策略基于一个前提,就是小学生A和小学生B的工作没有什么依赖性,是互相独立的。但有一点需要强调,虽然GPU是为了图像处理而生的,但是我们通过前面的介绍可以发现,它在结构上并没有专门为图像服务的部件,只是对CPU的结构进行了优化与调整,所以现在GPU不仅可以在图像处理领域大显身手,它还被用来科学计算、密码破解、数值分析,海量数据处理(排序,Map-Reduce等),金融分析等需要大规模并行计算的领域。所以GPU也可以认为是一种较通用的芯片。另赠送:APU – Accelerated Processing Unit, 加速处理器,AMD公司推出加速图像处理芯片产品。BPU – Brain Processing Unit, 地平线公司主导的嵌入式处理器架构。自动驾驶CPU – Central Processing Unit 中央处理器, 目前PC core的主流产品。DPU – Deep learning Processing Unit, 深度学习处理器,最早由国内深鉴科技提出;另说有Dataflow Processing Unit 数据流处理器, Wave Computing 公司提出的AI架构;Data storage Processing Unit,深圳大普微的智能固态硬盘处理器。FPU – Floating Processing Unit 浮点计算单元,通用处理器中的浮点运算模块。GPU – Graphics Processing Unit, 图形处理器,采用多线程SIMD架构,为图形处理而生。HPU – Holographics Processing Unit 全息图像处理器, 微软出品的全息计算芯片与设备。IPU – Intelligence Processing Unit, Deep Mind投资的Graphcore公司出品的AI处理器产品。MPU/MCU – Microprocessor/Micro controller Unit, 微处理器/微控制器,一般用于低计算应用的RISC计算机体系架构产品,如ARM-M系列处理器。NPU – Neural Network Processing Unit,神经网络处理器,是基于神经网络算法与加速的新型处理器总称,如中科院计算所/寒武纪公司出品的diannao系列。RPU – Radio Processing Unit, 无线电处理器, Imagination Technologies 公司推出的集合集Wifi/蓝牙/FM/处理器为单片的处理器。TPU – Tensor Processing Unit 张量处理器, Google 公司推出的加速人工智能算法的专用处理器。目前一代TPU面向Inference,二代面向训练。另外,VPU – Vector Processing Unit 矢量处理器,Intel收购的Movidius公司推出的图像处理与人工智能的专用芯片的加速计算核心。WPU – Wearable Processing Unit, 可穿戴处理器,Ineda Systems公司推出的可穿戴片上系统产品,包含GPU/MIPS CPU等IP。XPU – 百度与Xilinx公司在2017年Hotchips大会上发布的FPGA智能云加速,含256核。ZPU – Zylin Processing Unit, 由挪威Zylin 公司推出的一款32位开源处理器。当26个字母被用完后,即将出现XXPU,XXXPU,并以更快的速度占领起名界。
文章
机器学习/深度学习  ·  缓存  ·  人工智能  ·  并行计算  ·  自动驾驶  ·  芯片  ·  计算机视觉  ·  异构计算  ·  SoC  ·  AI芯片
2022-01-13
一文多图搞懂KITTI数据集下载及解析
KITTI DatasetTip:具体下载请参考:https://blog.csdn.net/lovely_yoshino/article/details/1049965501 简介KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。该数据集用于评测立体图像(stereo),光流(optical flow),视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达15辆车和30个行人,还有各种程度的遮挡与截断。 3D目标检测数据集由7481个训练图像和7518个测试图像以及相应的点云数据组成,包括总共80256个标记对象。下图红色框标记的为我们需要的数据,分别是彩色图像数据(12GB)、点云数据(29GB)、相机矫正数据(16MB)、标签数据(5MB)。其中彩色图像数据、点云数据、相机矫正数据均包含training(7481)和testing(7518)两个部分,标签数据只有training数据。1.1 数据采集平台各设备坐标系、距离信息由上图可见。坐标系转换原理参见click。其实KITTI提供的数据中都包含三者的标定文件,不需人工转换。1.2 坐标系camera: x = right, y = down, z = forwardvelodyne: x = forward, y = left, z = upGPS/IMU: x = forward, y = left, z = up1.3 image文件 image文件以8位PNG格式存储,图集如下:1.4 velodyne文件 velodyne文件是激光雷达的测量数据(绕其垂直轴(逆时针)连续旋转),以“000001.bin”文件为例,内容如下:7b14 4642 1058 b541 9643 0340 0000 0000 46b6 4542 1283 b641 3333 0340 0000 0000 4e62 4042 9643 b541 b072 0040 cdcc 4c3d 8340 3f42 08ac b541 3bdf ff3f 0000 0000 e550 4042 022b b841 9cc4 0040 0000 0000 10d8 4042 022b ba41 4c37 0140 0000 0000 3fb5 3a42 14ae b541 5a64 fb3f 0000 0000 7dbf 3942 2731 b641 be9f fa3f 8fc2 f53d cd4c 3842 3f35 b641 4c37 f93f ec51 383e dbf9 3742 a69b b641 c3f5 f83f ec51 383e 2586 3742 9a99 b741 fed4 f83f 1f85 6b3e . . . 点云数据以浮点二进制文件格式存储,每行包含8个数据,每个数据由四位十六进制数表示(浮点数),每个数据通过空格隔开。一个点云数据由四个浮点数数据构成,分别表示点云的x、y、z、r(强度 or 反射值),点云的存储方式如下表所示:1.5 calib文件calib文件是相机、雷达、惯导等传感器的矫正数据。以“000001.txt”文件为例,内容如下:P0: 7.215377000000e+02 0.000000000000e+00 6.095593000000e+02 0.000000000000e+00 0.000000000000e+00 7.215377000000e+02 1.728540000000e+02 0.000000000000e+00 0.000000000000e+00 0.000000000000e+00 1.000000000000e+00 0.000000000000e+00 P1: 7.215377000000e+02 0.000000000000e+00 6.095593000000e+02 -3.875744000000e+02 0.000000000000e+00 7.215377000000e+02 1.728540000000e+02 0.000000000000e+00 0.000000000000e+00 0.000000000000e+00 1.000000000000e+00 0.000000000000e+00 P2: 7.215377000000e+02 0.000000000000e+00 6.095593000000e+02 4.485728000000e+01 0.000000000000e+00 7.215377000000e+02 1.728540000000e+02 2.163791000000e-01 0.000000000000e+00 0.000000000000e+00 1.000000000000e+00 2.745884000000e-03 P3: 7.215377000000e+02 0.000000000000e+00 6.095593000000e+02 -3.395242000000e+02 0.000000000000e+00 7.215377000000e+02 1.728540000000e+02 2.199936000000e+00 0.000000000000e+00 0.000000000000e+00 1.000000000000e+00 2.729905000000e-03 R0_rect: 9.999239000000e-01 9.837760000000e-03 -7.445048000000e-03 -9.869795000000e-03 9.999421000000e-01 -4.278459000000e-03 7.402527000000e-03 4.351614000000e-03 9.999631000000e-01 Tr_velo_to_cam: 7.533745000000e-03 -9.999714000000e-01 -6.166020000000e-04 -4.069766000000e-03 1.480249000000e-02 7.280733000000e-04 -9.998902000000e-01 -7.631618000000e-02 9.998621000000e-01 7.523790000000e-03 1.480755000000e-02 -2.717806000000e-01 Tr_imu_to_velo: 9.999976000000e-01 7.553071000000e-04 -2.035826000000e-03 -8.086759000000e-01 -7.854027000000e-04 9.998898000000e-01 -1.482298000000e-02 3.195559000000e-01 2.024406000000e-03 1.482454000000e-02 9.998881000000e-01 -7.997231000000e-011.6 label文件 label文件是KITTI中object的标签和评估数据,以“000001.txt”文件为例,包含样式如下:Truck 0.00 0 -1.57 599.41 156.40 629.75 189.25 2.85 2.63 12.34 0.47 1.49 69.44 -1.56 Car 0.00 0 1.85 387.63 181.54 423.81 203.12 1.67 1.87 3.69 -16.53 2.39 58.49 1.57 Cyclist 0.00 3 -1.65 676.60 163.95 688.98 193.93 1.86 0.60 2.02 4.59 1.32 45.84 -1.55 DontCare -1 -1 -10 503.89 169.71 590.61 190.13 -1 -1 -1 -1000 -1000 -1000 -10 DontCare -1 -1 -10 511.35 174.96 527.81 187.45 -1 -1 -1 -1000 -1000 -1000 -10 DontCare -1 -1 -10 532.37 176.35 542.68 185.27 -1 -1 -1 -1000 -1000 -1000 -10 DontCare -1 -1 -10 559.62 175.83 575.40 183.15 -1 -1 -1 -1000 -1000 -1000 -10每一行代表一个object,每一行都有16列分别表示不同的含义,具体如下:第1列(字符串):代表物体类别(type)总共有9类,分别是:Car、Van、Truck、Pedestrian、Person_sitting、Cyclist、Tram、Misc、DontCare。其中DontCare标签表示该区域没有被标注,比如由于目标物体距离激光雷达太远。为了防止在评估过程中(主要是计算precision),将本来是目标物体但是因为某些原因而没有标注的区域统计为假阳性(false positives),评估脚本会自动忽略DontCare区域的预测结果。第2列(浮点数):代表物体是否被截断(truncated)数值在0(非截断)到1(截断)之间浮动,数字表示指离开图像边界对象的程度。第3列(整数):代表物体是否被遮挡(occluded)整数0、1、2、3分别表示被遮挡的程度。第4列(弧度数):物体的观察角度(alpha)取值范围为:-pi ~ pi(单位:rad),它表示在相机坐标系下,以相机原点为中心,相机原点到物体中心的连线为半径,将物体绕相机y轴旋转至相机z轴,此时物体方向与相机x轴的夹角,如图1所示。第5~8列(浮点数):物体的2D边界框大小(bbox)四个数分别是xmin、ymin、xmax、ymax(单位:pixel),表示2维边界框的左上角和右下角的坐标。第9~11列(浮点数):3D物体的尺寸(dimensions)分别是高、宽、长(单位:米)第12-14列(整数):3D物体的位置(location)分别是x、y、z(单位:米),特别注意的是,这里的xyz是在相机坐标系下3D物体的中心点位置。第15列(弧度数):3D物体的空间方向(rotation_y)取值范围为:-pi ~ pi(单位:rad),它表示,在照相机坐标系下,物体的全局方向角(物体前进方向与相机坐标系x轴的夹角),如图1所示。第16列(整数):检测的置信度(score)要特别注意的是,这个数据只在测试集的数据中有**(待确认)**。1.7 KITTI可视化 目前已经完成了pointcloud、gt boxes、label、dt boxes(PointRCNN)等可视化,后续会把体素化加进去,先贴个可视化效果图:2. 激光数据首先在官网KITTI下载 raw data development kit,其中的readme文件详细记录了你想知道的一切,数据采集装置,不同装置的数据格式,label等。激光数据是什么形式呢?激光照射到物体表面产生大量点数据,KITTI中的点数据包括四维x,y,z以及reflectance反射强度。Velodyne 3D激光产生点云数据,以.bin(二进制)文件保存。Velodyne 3D laser scan data =========================== The velodyne point clouds are stored in the folder 'velodyne_points'. To save space, all scans have been stored as Nx4 float matrix into a binary file using the following code: stream = fopen (dst_file.c_str(),"wb"); fwrite(data,sizeof(float),4*num,stream); fclose(stream); Here, data contains 4*num values, where the first 3 values correspond to x,y and z, and the last value is the reflectance information. All scans are stored row-aligned, meaning that the first 4 values correspond to the first measurement. Since each scan might potentially have a different number of points, this must be determined from the file size when reading the file, where 1e6 is a good enough upper bound on the number of values: // allocate 4 MB buffer (only ~130*4*4 KB are needed) int32_t num = 1000000; float *data = (float*)malloc(num*sizeof(float)); // pointers float *px = data+0; float *py = data+1; float *pz = data+2; float *pr = data+3; // load point cloud FILE *stream; stream = fopen (currFilenameBinary.c_str(),"rb"); num = fread(data,sizeof(float),num,stream)/4; for (int32_t i=0; i<num; i++) { point_cloud.points.push_back(tPoint(*px,*py,*pz,*pr)); px+=4; py+=4; pz+=4; pr+=4; } fclose(stream); x,y and y are stored in metric (m) Velodyne coordinates. IMPORTANT NOTE: Note that the velodyne scanner takes depth measurements continuously while rotating around its vertical axis (in contrast to the cameras, which are triggered at a certain point in time). This means that when computing point clouds you have to 'untwist' the points linearly with respect to the velo- dyne scanner location at the beginning and the end of the 360掳 sweep. The time- stamps for the beginning and the end of the sweeps can be found in the time- stamps file. The velodyne rotates in counter-clockwise direction. Of course this 'untwisting' only works for non-dynamic environments. The relationship between the camera triggers and the velodyne is the following: We trigger the cameras when the velodyne is looking exactly forward (into the direction of the cameras). 官方提供的激光数据为N*4的浮点数矩阵,raw data development kit中的matlab文件夹是官方提供matlab接口,主要是将激光数据与相机数据结合,在图像上投影。matlab接口详解及使用 最终可以将点云数据保存为pcd格式,然后用pcl进行相应处理。
文章
存储  ·  数据采集  ·  传感器  ·  数据可视化  ·  自动驾驶  ·  算法  ·  定位技术  ·  计算机视觉  ·  数据格式
2022-01-13
无人车行人识别---opencv
无人车行人识别---opencv无人车行人识别---opencv行人检测具有极其广泛的应用:智能辅助驾驶,智能监控,行人分析以及智能机器人等领域。从2005年以来行人检测进入了一个快速的发展阶段,但是也存在很多问题还有待解决,主要还是在性能和速度方面还不能达到一个权衡。近年,以谷歌为首的自动驾驶技术的研发正如火如荼的进行,这也迫切需要能对行人进行快速有效的检测,以保证自动驾驶期间对行人的安全不会产生威胁。本文使用 HOG + SVM 并通过NMS在Python环境下实现识别HOG: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。HOG特征通过计算和统计图像局部区域的梯度方向直方图来构成特征. SVM: (Support Vector Machine)指的是支持向量机,是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析, 在行人检测中可以用作区分行人和非行人的分类器。from __future__ import print_function ##兼容python2.x,python2.x同样可以加括号 from imutils.object_detection import non_max_suppression##非极大值抑制,控制多个重叠的边框(bounding box),并且将他们减少至仅有一个边框。 from imutils import paths import numpy as np import imutils import argparse import cv2 capture = cv2.VideoCapture(0) while(True): # 调用hog = cv2.HOGDescriptor()来初始化方向梯度hog hog = cv2.HOGDescriptor() #调用setSVMDetector来设置支持向量机(Support Vector Machine)使得它成为一个预先训练好了的行人检测器。 hog.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector()) # 获取一帧 ret, image = capture.read() # 调整大小,以减少检测时间,并能够整体提高行人检测的精度。 image = imutils.resize(image, width=min(400, image.shape[1])) orig = image.copy() #构造了一个尺度scale=1.05的图像金字塔,以及一个分别在x方向和y方向步长为(4,4)像素大小的滑窗。 #返回一个二元组的rects,或者是图像中每一个行人的边框坐标(x,y),以及由SVM在每一次检测中返回的weights置信值 (rects, weights) = hog.detectMultiScale(image, winStride=(4,4), padding=(8,8),scale=1.05) #绘制长方形 for (x, y, w, h) in rects: cv2.rectangle(orig,(x,y),(x + w, y + h), (0,0,255), 2) #对边界框应用非最大值抑制,使用相当大的重叠阈值,以尝试保持重叠的人框 rects = np.array([[x,y, x + w, y + h] for (x, y, w, h) in rects]) pick = non_max_suppression(rects, probs=None, overlapThresh=0.65)#0.65的nms #绘制矩形 for (xA, yA, xB, yB) in pick: cv2.rectangle(image, (xA, yA), (xB, yB), (0,255,0),2) #打印信息 print("[INFO]: {} original boxes, {} after suppression".format(len(rects), len(pick))) cv2.imshow("After NMS",image) if cv2.waitKey(1) == ord('q'): break
文章
机器学习/深度学习  ·  监控  ·  自动驾驶  ·  安全  ·  机器人  ·  计算机视觉  ·  Python
2022-01-13
1
...
11 12 13 14 15 16 17 18 19 20
跳转至:
新智元
178 人关注 | 0 讨论 | 1298 内容
+ 订阅
  • 当AI学会回忆:Deepmind提出长期信度分配新算法,登上Nature子刊
  • 整个宇宙就是一台巨型量子计算机!俄新研究颠覆宇宙学理论
  • Twitter要改版成Reddit风格?官方高仿号Twttr公测已近1年,明年或将正式推出
查看更多 >
机器之心
1 人关注 | 0 讨论 | 1040 内容
+ 订阅
查看更多 >
人工智能
2599 人关注 | 9268 讨论 | 62207 内容
+ 订阅
  • 缓存穿透了怎么办?
  • KMeans聚类算法详解
  • 从BERT、XLNet到MPNet,细看NLP预训练模型发展变迁史
查看更多 >
安全
1034 人关注 | 23272 讨论 | 52353 内容
+ 订阅
  • 实战教程:如何将自己的Python包发布到PyPI上
  • 软件设计思想:池化技术
  • Java+Swing+Mysql实现停车场管理系统(上)
查看更多 >
开发与运维
5194 人关注 | 125229 讨论 | 185793 内容
+ 订阅
  • 实战教程:如何将自己的Python包发布到PyPI上
  • Java+JSP+Mysql+Tomcat实现Web用户信息管理系统
  • 缓存穿透了怎么办?
查看更多 >