专访金榕:四年蜕变,阿里iDST是如何登上浪潮之巅的?

简介: 经历教授到院长身份转变的金榕,向我们阐述了一个前沿技术团队在阿里巴巴寻求突破的过程,以及对如何发挥团队自身价值的实践领悟。

原文标题:专访 | 下沉、重聚、归位背后,是一位学者转身业界带领阿里iDST建立技术「影响力」的四年

两个月前,在杭州阿里巴巴西溪园区的一间会议室里,机器之能见到了阿里巴巴 iDST 院长金榕。

金榕风风火火地进来,在会议桌靠近门口的一侧坐下。他说话很快,由于长期在美国求学工作的原因,句子中夹杂着英文。事实上,iDST 院长这个位置是金榕在产业界的首次亮相。此前,从卡内基梅隆大学博士毕业的他在密歇根州立大学教书多年,并已是该校终身教授。

自 2014 年加入数据科学与技术研究院(Institute of Data Science and Technologies,简称 iDST )以来,金榕教授所做的一系列工作,就是让类似「人工智能驱动企业增长」的技术方案落地。

过去几年,BAT 试图通过在研发上的大手笔投资以及收购,企图在短时间内找出自身产品与服务和人工智能技术的结合点。然而急于部署人工智能,这并不是明智的选择,因为往往公司内部的技术人员不能够准确评估人工智能的商业价值。在另一方面,纸上谈兵的人工智能创业公司层出不穷,这使其领域内公司的商业价值水分增加。

行业的困局,或许可以从金榕过去几年的经历中找到答案。从西雅图到杭州、从带博士生到带团队、从提升论文 benchmark 到完成部门目标,这位严谨的学者在过去几年经历了一次次对技术商业应用认知上的冲击。

经历教授到院长身份转变的金榕,向我们阐述了一个前沿技术团队在阿里巴巴寻求突破的过程,以及对如何发挥团队自身价值的实践领悟。

连接人工智能的业务和技术线

与 2017 年营收 1582.73 亿人民币、近 5 万全球员工和 56% 营业额增长相呼应, iDST 需要接触庞大的业务生态圈。其中包括阿里旗下的 8 家线上购物平台—— LAZADA、阿里巴巴、alibaba.com、AliExpress、淘宝、天猫、聚划算和飞猪;以及关联业务——蚂蚁金服、阿里妈妈、高德地图、UC 浏览器、优酷土豆以及菜鸟物流。单蚂蚁金服一项,其支付宝业务就渗透全球了 30 多个国家,覆盖 5.2 亿用户,用户人数接近北美人口的总和。

仅凭上述数据,我们就不难理解为什么阿里巴巴能够吸引诸如前亚马逊最高级别华人科学家任小枫等顶尖技术人才的加入。

面对企业内部务实的作风,iDST 团队梳理了几个着重点:检索、语音、语义、图像、视频和模型优化。同时也提出了目前侧重的四个人工智能技术应用方向(如下图):

1


在计算机视觉领域,一个典型应用产品「拍立淘」,是金榕团队用深度学习开发出来的拍照购物神器。通过精准识别实拍图,用户可以使用拍立淘通过图片搜索几乎所有淘宝商品,从网红坚果、新款电子产品、夏季连衣裙、进口手办到欧款木制家具。
从技术层面上来讲,拍立淘的深度模型将用户的查询图片、点击图片、和未点击图片构建成一组特征学习框架,利用深度卷积网络提高搜索精确度。金榕的团队还利用迁移学习将该模型应用在其他领域中。在过往线性迁移的基础上,团队算法引入随机傅里叶函数,利用非线性学习方法提高系统的鲁棒性。目前该迁移模型在谷歌 Open Images 数据库的 Top
10 准确度达到了 57.91%,高于直接使用 Open Images 数据训练的 GoogleNet V3 的 53%。


2
拍立淘用户界面展示

根据金榕介绍,拍立淘数据库中包含超过 10 亿个商品,以及 1400 万日活跃用户。这组数据规模到底有多大?学界熟知的 ImageNet 数据库大概保存了 1500 万张照片,而拍立淘每一天上传的图片就比这个要多。「我们研发了快速高精度的检索索引技术使得海量的数据分析成为可能。」

另一个值得一提的是组合优化技术,金榕向我们讲述了 3D 装箱优化技术的应用。目前阿里巴巴旗下的菜鸟物流一直在运筹优化上寻找突破点。其中一个问题是如何使用表面体积最小的箱子,依照最优的次序放置、打包物品,从而降低运营成本。阿里的模型将待打包的物品尺寸输入 Deep-Q 模型,计算出所需的最小容器,再用强化学习找到最佳的打包方式。目前利用这个方法可以节省 5% 的包装消耗。

3

5% 看上去不是一个很大的比例,但仅在 2016 年的双11购物节,阿里巴巴就产生了 6.57 亿笔物流订单。这也就意味着每年能节省近 3285 万件订单的打包成本。与此同时,阿里巴巴在仓储以及配送的技术优化也非常出色。统计数据显示,在 2013 年双 11 的快递平均送达时间是 9 天,到了 2016 年则缩减至 3 天半。

在 2017 年的双 11,他们将这样的技术从仓库迁移到数据中心,研发的数据中心资源分配技术,能够将分配率拉升到 90% 以上,在部分业务中节省一半服务器,并以 2 秒的速度锁定异常机器,命中率达到 94%。

除此之外,免唤醒地铁语音购票机、国家人工智能开放平台城市大脑、聊天机器人阿里小蜜等,这些项目的很多核心技术都是来自于 iDST。
这是金榕口中的技术「影响力」。「在公司里,你用技术可以影响到上亿用户的生活。」金榕说,「而在学界很难做到类似的影响。在学校你也许工作很久,最后的结果仅仅是将某个 benchmark 提升 5%、10%。」

对科学家来说,企业的海量数据就像是一个开放式的游乐场,提供了学者在学校工作难以实现的可能性。

前沿技术团队寻找价值与突破的过程

这显然不是一路坦途。

尽管 4 年前,阿里巴巴成立 iDST 时对技术研究目标野心满满。那时候,iDST 很快就组起了一个 30 人左右的团队,聚集了众多曾在研究方面颇有建树的专家,包括现任院长金榕、现蚂蚁金服首席数据科学家漆远等。

成立初期,iDST 承接了包括建立超大规模 GPU 机器学习集群、机器学习平台 PAI、以及帮助聚划算进行商品排序提高运营效率等任务。然而,iDST 的这些技术没能如预期般顺利落地。

当时,在业务线同事们的眼中,这些科学家是「不懂商业场景的人」。
金榕讲到一个例子。在帮助聚划算进行商品排序的过程中,科学家们很自然地想要将性价比更高、更划算的商品放在前面,也确实有效地增加了营收。但由于较为便宜的商品占据了相对明显的位置,整个聚划算的用户群开始向三四线城市倾斜,用金榕的话说,「聚划算产品的价值都变了。」

「这不是科技可以解决的问题,你把 GMV(一定时间段内的成交总额)提高了,但却改变产品本身的定位。」对于到底怎样做才是有价值的,金榕很困惑,他说,「可能没有人有确切的答案。」

他慢慢地意识到,从整个集团的角度而言,科技并不只是计算数字的工具,而是要真正和场景结合起来,把业务做好。他认为,如果团队对场景没有清晰的认识,和业务脱节,那么在阿里,iDST 的技术将永远没有办法产生价值。

2015 年 7 月开始,他们决定走到到业务中去。金榕带领一队人马进入搜索事业部、漆远到蚂蚁金服、一些从事语音方向的研究人员到阿里云。

他们从手边事做起,也开始扮演关键先生的角色,「我们无条件地来帮忙做产品。」金榕回忆道。搜索事业部的产品新版本由于一个 Bug 没有解决而迟迟不能上线,金榕团队帮忙排查原因发现,是技术人员将公式 A/(B+C)写成了 A/B+C。「你不要小看这件事情。」金榕说,排查像这样的细微问题,最考验一个人对程序的感知能力。新版本上线那么多行代码,肯定不能从头开始一行一行地看、一行一行地查,对「哪些数据不太对劲儿」的敏锐嗅觉是查出这个 Bug 的关键所在。
但在深入业务的过程中,团队的一些成员因为不适应而离开,「当你自己都还在寻找价值的时候,你是很难说服别人进来跟你一起并肩作战的。」金榕说。

他坦言,那时候团队的动荡,让他有些自责。在金榕心里,这些人是他一手招进来的,他应该让他们付出的智慧得到应有的回报。

走出过渡期,「要做人工智能技术最底层的创新」

「现在来看,每个人都是自己人生的主人,每个人都要对自己负责任。」金榕说。而他和他领导的iDST也走出过渡期。
马云提出「大中台、小前台」战略,让各个业务线在一个强大的、动态的「中台」支撑下,仅用几个人手就能搭建起稳定的前台服务。
这有些类似项目制与产品制的区别。项目制随着业务的爆发,所需人力也随之爆发,且项目间的经验很难复用、累积。产品制更轻、更巧、更专,只需对不同的项目需求做少量定制化,在成本方面更加可控,在技术方面也能有所积累。

由此,2017年 3 月,在集团组织部大会上,阿里巴巴 CTO 张建锋明确要让分到各个业务线上的 iDST 成员重聚,并强调了 iDST 的定位——成为阿里巴巴集团面向未来的 AI 研发核心力量。
现在,阿里巴巴的 AI 研发「大中台」放在 iDST,通过调用接口的方式供业务线使用,通过阿里云向外部输出。目前,iDST 在西雅图、杭州、北京、硅谷都有分部。海外部门侧重于基础研究,杭州团队侧重应用研究,他们克服约 1 万公里的地理距离、15 个小时的时差,互相协调数百人的团队工作。

金榕开始设计 iDST 的核心技术目标,要做人工智能技术最底层的创新。

「一个公司要在市场上获得地位,没有黑科技怎么可能。你用的都是跟大家一样的东西,那市场为什么选你?」金榕认为,团队有实力创造出一种学习模型,能够在实操业务层面比当前从实验室中走出来的模型表现更优。

金榕有点像是一个深度学习的挑战者。在他看来,由于深度学习技术发展到现在,各种模型、框架已经被封装得很好,工程师们更多的是「拿来用」,很少有人会真正对技术背后的原理进行思索。
另一方面,金榕说,现在的深度学习技术,最可怕的地方在于,你不知道它不能做什么,不知道它的边界在哪里。没有人知道某个模型在某个具体任务上为什么好用,为什么不好用。如果不好用的话,那就换一个模型继续尝试。而现在的学术评价体系促使大家更多记录成功,「很少有论文的主题是写一件事情是如何失败的,」金榕说,「这很糟糕,很多聪明人在试同样的错。」

金榕希望改变这样的局面,真正地从底层技术驱动创新。
2017 年云栖大会上,阿里巴巴宣布成立达摩院,瞄准未来突破性技术的研究。也许,阿里巴巴这样一家电商公司强化技术的决心,会给金榕更多时间和信心。「如果所有的商业公司不能容忍技术自身的发展规律,那么我认为,今天的一切都不可能发生。」
对海外优秀技术人才的吸引力,也在提升。阿里巴巴在卡内基梅隆大学举办校招,座无虚席,即便不打算加入的学生,也想多了解一些。与几年前相比,国内互联网公司的人才竞争力正逐年递增。与 BT(百度、腾讯)和 FLAG(Facebook、LinkedIn、Amazon、Google)相比,阿里巴巴这家公司的情况究竟是怎样的?
我们向校招现场的学生做了个小调查:

4


数据显示,27% 的学生对阿里的平台影响力有信心,58% 的学生在 BAT 里更青睐阿里巴巴,而这其中选择 1-3 年内回国的人高达 42%。

正在 CMU 攻读博士后的杜同学和金榕有过短暂交谈,他告诉我们,除去留在美国还是回国的选择,是否选择阿里巴巴取决于项目本身,以及领导团队的默契。当我们询问金榕在寻找什么样的人才时,他说,「拥有良好的踏实感与商业好奇心是技术人才在业界成功的必备品质。」

这更像是金榕转换轨道经历 iDST 变化之后的总结式感悟,「(做技术的人)也要对业务有理解,能够沉下心来理解商业运作模式,否则一切努力只是个人一厢情愿。」

然而,平衡业务需求和技术研发之间的衔接关系,是商业化公司的长期挑战,焕发新生后 iDST 的征程仍然漫长。

原文发布时间为:2018-01-07
本文作者:李九喻、王艺
本文来自云栖社区合作伙伴“机器之心”,了解相关信息可以关注“机器之心”。

相关文章
|
缓存 NoSQL Java
商汤科技面试总结(下)
十、a,b,c三张表,做关联查询,如何优化,可做外键,只在c表加a表外键即可。
264 0
商汤科技面试总结(下)
|
消息中间件 存储 分布式计算
商汤科技面试总结(上)
一、kafka数据分区和消费者的关系,kafka的数据offset读取流程,kafka内部如何保证顺序,结合外部组件如何保证消费者的顺序
230 0
商汤科技面试总结(上)
|
消息中间件 缓存 分布式计算
商汤科技面试总结
一、kafka数据分区和消费者的关系,kafka的数据offset读取流程,kafka内部如何保证顺序,结合外部组件如何保证消费者的顺序
280 0
商汤科技面试总结
探访草根云计算大咖的成长历程
【阿里云推广奖励计划】技术变现,年入百万不是梦立即加入上一周,云大使张昕成为了阿里云奖励计划启动后首位获得百万返佣的优秀大使,一时间,许多人都为之震撼。究竟是什么力量与方法使得这样以为来自吉林长春的小姑娘可以获得如此成就,从一窍不通的小白到如今无所不知的云大使的领头人,她的亲身经历将会告诉我们只要不敢想,年入百万,技术变现将不再是想想而已,而是会变成你肉眼可见的每一份获利。
18249 0
|
人工智能
启迪之星刘博:优秀的创业者=家国情怀+学者智慧+商业思维+江湖行动 | 36氪阿里AI赛道明星班
2018年8月,阿里巴巴携手36氪,启动了“AI赛道明星班”项目。8月20日,“AI赛道明星班”第一次集结,开启为期四天的培训课程。活动第二天,启迪之星总经理兼主管合伙人刘博从投资人的视角分享了打动她的创业者类型。
885 0
|
城市大脑
阿里巴巴王坚:用数据来改变世界
7月21日,阿里巴巴技术委员会主席王坚在2019年中国电子政务论坛上发表演讲。他表示,现在智慧城市建设有很多的误区。但与很多顶尖公司用数据解释这个世界不同,浙江政府是从数据多跑一次开始第一个用数据在改变世界。
8797 0
|
机器学习/深度学习 云计算
100位云计算专家齐聚湖畔大学,就是为了这件事! ——阿里云MVP全球闭门会四大看点抢先看
9月18日,阿里云MVP(最有价值专家)全球闭门会将在湖畔大学举行,共有近100位阿里云MVP参加会议。阿里云技术专家也将到场,进行文化分享和技术交流。