11.2公里/秒,这是火箭脱离地球进入外太空的最低速度,也被称为“逃逸速度”。去年,高通公司一位执行副总裁在与商汤科技创始人、香港中文大学教授汤晓鸥“切磋了”一番技术和产品之后,深有感触地说道:“我们两家公司都是追求同一种速度,那就是逃逸速度。”
最近老冀参加了小米、OPPO、魅族等很多手机厂商的发布会,惊奇地发现商汤的人工智能技术已经成了与高通的骁龙移动平台一样的“标配”。这其实也说明,商汤正在接近“逃逸速度”。
能够突破“逃逸速度”的公司,意味着它将在行业中处于遥遥领先的地位,不仅能够引领行业的发展趋势,而且还能够创造远高于友商的股东价值。前不久,商汤科技获得了由阿里巴巴集团领投、淡马锡和苏宁等跟投的6亿美元C轮融资,这也是当时人工智能领域最大的一笔单轮融资。彭博社、《华尔街日报》等海外媒体纷纷惊呼,商汤科技成为全球最具价值的人工智能平台公司。
4月28日,由华东师范大学慕课中心、商汤科技、上海知名高中优秀教师共同编著的全球第一本人工智能教材“《人工智能基础(高中版)》”正式发布,华东师范大学第二附属中学、上海交通大学附中、清华大学附属中学、上海市市西中学等40所全国学校成为首批“人工智能教育实验基地学校”。作为教材编委成员,汤晓鸥教授还亲自为大家上了第一堂AI课。这也意味着,商汤科技正在参与中国人工智能教育标准的制订工作。
作为一家创立才不过3年半的公司,商汤科技凭什么能够像已经成立了30多年的高通那样,达到“逃逸速度”?在4月25日的creAIte 创以智用——2018商汤人工智能峰会上,商汤给出了答案。
技术垄断+人才垄断
老冀没想到,身为人工智能权威、科学家的汤晓鸥,竟然是非常有趣的一个人,幽默的科学家,不禁让人对AI科技更添一份兴趣。
汤晓鸥现场播放了电影《花样年华》的片段,通过商汤科技的人工智能技术,在男女主角梁朝伟和张曼玉出现的场景,能够捕捉两人的脸部,并且分析出他们表现出的情绪。当张曼玉留下了痛苦的眼泪的时候,汤晓鸥还不忘插上一句,“可惜最后是个悲剧”。
接着汤晓鸥Show了一下肌肉:在全球最权威的人工智能特别是计算机视觉顶级学术会议——国际计算机视觉与模式识别大会(CVPR)上,商汤科技与香港中文大学-商汤科技联合实验室累计发表了119篇论文,仅排在微软(191篇)和卡内基梅隆大学(151篇)之后,超过了科技巨头Google(91篇)。在今年的CVPR上,商汤科技与香港中文大学-商汤科技联合实验室又一口气发表了44篇论文,碾压排在第二三名的Google和Facebook。
其实,虽然商汤科技创立的时间不长,但是在人工智能领域的积累时间却一点都不比美国的大学和科技巨头短。早在1992年,在美国麻省理工学院攻读博士学位的汤晓鸥开始接触人脸识别的算法。获得博士学位后,他先后在香港中文大学和微软亚洲研究院工作,继续从事计算机视觉相关领域的研究。
2001年,汤晓鸥建立了香港中文大学多媒体实验室。2014年3月,汤晓鸥团队发布了研究成果,他们基于原创的人脸识别算法准确率达到了98.52%,首次超过了人眼识别能力(97.53%)。2016年,他率领的人工智能团队与麻省理工、斯坦福等著名大学一道,入选世界十大人工智能先锋实验室,成为亚洲区唯一入选的实验室。
IDG资本合伙人牛奎光正是因为看到了这些报道之后,之前学计算机专业的他激动不已,专门前往香港拜访汤晓鸥。在这里,他看到了五六个计算机识别技术的Demo,其中一个是把图片变成印象派画风,然后毫不犹豫地投下了重注。“这是我们IDG唯一的一个还没有看到产品就投资的项目。”
从人工智能领域的论文数量和科研成果来看,商汤在国内已经形成了一定程度的“技术垄断”。
商汤科技还做了另一件“技术垄断”的事情,就是建起了全中国最大的深度学习超算中心,目前拥有超过 8000 块 GPU,打造超强的生产工具。目前,商汤科技每天有150多个博士在这个超算中心上训练人工智能模型。
之所以能够做到“技术垄断”,恰恰是因为商汤科技具备强大的自主创新能力:商汤并没有采用Google和Facebook用开源框架搭建的Tensor Flow、Caffe 等深度学习平台,而是自主研发了一套原创的深度学习平台 Parrots。
当然,牛奎光之所以如此看重商汤科技,除了“技术垄断”之外,还有“人才垄断”。
除了通过香港中文大学-商汤科技联合实验室,源源不断地向商汤输入AI人才之外,2014-2016年期间商汤还用打包方案找来了这个领域所有能够找到的顶尖科学家,储备了大量深度学习领域的人才,包括即将毕业的顶尖科学家。前不久,商汤科技又宣布与另一家在人工智能领域领先的麻省理工学院成立人工智能联盟,进一步“垄断”人工智能领域的研究人才。
最近一两年,BAT等国内科技巨头开始大规模进入人工智能领域,才意识到AI研究人才的奇缺,以至于创新工场创始人李开复在4月26日的GMIC(世界移动互联网大会)上透露,中国的AI人才的薪资已经是美国的2倍。
如今,商汤科技又进一步向教育领域赋能,将AI人才的培养延伸到了高中阶段。在发布《人工智能基础(高中版)》教材当天,商汤科技还与包括清华大学附属中学、上海交通大学附属中学在内的40多所学校签约共建“人工智能教育实验基地学校”。商汤科技还将结合教材中的知识点,与华东师范大学、商务印书馆一道,在中小学开展人工智能教师培训、中小学人工智能实验室建设、智慧校园建设。
与此同时,商汤科技还分别在上海市市西中学、华东师范大学设立了集人脸识别系统、人群分析系统、学生行为监测系统、教学实验平台、机器人、无人车等于一体的人工智能实验室,并与未来知名公司联手推出“商汤杯全国中学生人工智能大赛”,面向所有爱好AI的高中生广发“英雄帖”,真正把从理论到实践的教学理念发挥到极致。
当下,人工智能已成为各国争相竞争之地,但人工智能人才的短缺已日益凸显,各国都在加强AI人才的培养。《人工智能基础(高中版)》教材的发布,将人工智能的基础学习融入到高中阶段,这相当于为中国人工智能的发展挖了一口“人才蓄水池”。不只如此,从现在的教材内容来看,《人工智能基础(高中版)》教材主要以“手脑结合”为主要学习方式,这锻炼了学生的想象力、创造力、动手力等多方面的能力,对于学生潜能的挖掘、思维方式的培养也是大有益处。
老冀认为,如今人工智能技术的发展历程与其他技术最大的不同,就是研究成果与产业化几乎已经同步——就在学界不断发表人工智能研究成果的同时,产业界就已经在利用这些研究成果进行产业化。由此,必然会对人工智能的教育和人才培养提出了更高的挑战,教育界必须尽快同时培养出人工智能的研究、开发、咨询、服务等全领域的人才。如今,商汤科技从高中入手,正在打通了从高中到大学、从大学到产业界的人才培养的鸿沟,这无疑会加速中国人工智能生态圈的成熟步伐。
打造行业平台
在技术上足够匹敌美国巨头、碾压国内同行的情况下,商汤科技下一步要解决的就是将技术转化成产品,并且让客户接受的难题。
“这个团队是我见过的成长最快的团队。”牛奎光感叹道。在拿到投资之后,商汤科技迅速组建自己的工程团队,结合行业用户需求,实施“1+1+X战略”,即用底层技术支撑,同时进行多元化布局,率先将技术运用到多个行业。商汤科技的打法是找到各个垂直行业中的头部公司,搜索将AI技术落地的具体方式,通过实施项目,逐渐形成全行业通用的产品,然后打通整个行业的生态,做成平台。
“1+1+X战略”在手机行业已经初现成效。如今,商汤科技已经与小米、OPPO、vivo、高通、联发科技等行业领先者达成了合作。
2017年9月21日,vivo发布的首款全面屏手机vivo X20搭载了Face Wake 面部识别解锁功能,最快可实现0.1秒的快速识别。这套人脸解锁解决方案背后的提供商正是商汤科技,它采用了深度学习大规模训练的人脸识别算法,可在毫秒级别完成面部细节特征的匹配,能够从容面对各种复杂环境,并支持将人脸特征信息保存在TEE可信任执行区域以最大限度保护用户隐私。此外,vivo X20基于Dual Pixel摄像头的人脸解锁方案,不需要手机厂商在现有硬件上做出改动,能够大大降低应用成本。
如今,在经过多次迭代之后,在这次峰会上商汤科技拿出的就不再是产品,而是平台了——它推出了全新升级的SenseAR增强现实感绘制引擎和中国原创AR开发者平台——SenseAR开发者平台,双管齐下,合力驱动AR应用和优质内容产出,打造中国AR生态。
应用原创AI技术,商汤科技将AR识别和绘制能力从“脸部”延伸至“全身”,基于单目RGB摄像头,实现对手势、肢体动作的全方位精确描述和跟踪,满足不断增多的全身场景AR玩法需求。
此外,商汤科技还与OPPO合作推出以SenseAR为引擎的OPPO AR开发者平台,并吸引了京东、王者荣耀等超级APP入驻。在峰会上,现场演示的《王者荣耀》AR版本,手机用户能够将其中的角色融入到现实的场景中。
OPPO研究院院长刘畅表示,OPPO与商汤科技在2017年达成战略合作伙伴关系,双方将聚焦在AR开发者平台、智能美颜、双摄虚化、AR贴纸、人脸解锁、智能相册等多个满足用户核心需求的领域。
如今,商汤科技“1+1+X战略”中的“X”早就不限于手机行业,还广泛运用到了移动互联网、安防、金融、零售、自动驾驶等多个行业当中。
在这次峰会上,商汤科技联合创始人、CEO徐立和各产品线负责人除了现场演示了增强现实黑科技SenseAR之外,还演示了另外几个平台级产品:
1. 用于互联网、图像行业的智能图片视频审核平台:SenseMedia基于深度学习的智能内容审核方案,能够真正读懂视频,实现低成本、高效益、高精度地视频审核与内容抓取,有效过滤色情、暴力等有害信息,创造丰富多彩的视频内容。
2. 用于安防等行业的智慧城市、平安城市解决方案:商汤科技发布SenseFace 3.0、 SenseFoundry两大智能安防产品。SenseFace 3.0支持千路以上的监控系统进行长达数月的热数据实时轨迹还原,能够真正满足公安的城市监察治理需要。今年年初,商汤科技借助该平台,仅用了3小时就找回一位走失老人,帮助他与家人团聚。SenseFoundry方舟城市级视觉开放平台能应对超大规模化系统下,城市级公共安全与保障领域在规模、精度、成本等各方面的巨大技术挑战。
3. 用于汽车行业的驾驶员监控系统:商汤科技发布首款智能汽车产品SenseDrive DMS驾驶员监控系统,实现了对驾驶员疲劳驾驶、驾驶分心、危险动作等驾驶员状态的实时智能检测与提醒,为驾乘安全保驾护航。
“在过去的3年当中,商汤持续以400%的年化成长来高速发展,我相信这代表了现在的人工智能发展的速度。未来已来,我们希望能够利用技术的创新,利用技术的想象力,和我们的生态合作伙伴一起,推动AI时代的到来。”徐立表示。
看来,如今的商汤科技还在进一步加速,它希望尽快到达“逃逸速度”。老冀联想到习近平总书记最近视察武汉科技企业的时候指出,现在核心技术、关键技术、国之重器必须立足于自己;如今,商汤科技的自主创新,能够带给中国科技企业更多的启示。