谷歌新人李飞飞:击碎玻璃天花板的华裔女科学家-阿里云开发者社区

开发者社区> 开发者小助手-bz8> 正文

谷歌新人李飞飞:击碎玻璃天花板的华裔女科学家

简介: 本周二,谷歌宣布斯坦福大学教授李飞飞加入其云团队。作为第一代中国移民,这位图像识别领域的杰出学者是如何从普林斯顿进入斯坦福,最后成为谷歌人工智能团队新任领导者的?让我们来了解一下这名华裔学者的传奇经历吧。
+关注继续查看


实现美国梦


3D639EC6-383D-45D9-8912-0DD6AB1B717F.jpeg

1976 年,李飞飞出生于北京,后来在四川长大


如果你真想做一件事,全世界都会来帮你。16 岁刚来美国的那两年,李飞飞却只能从依靠自己开始。在帕西悉尼的白人圈子中,这位亚裔姑娘显得有点孤独,她像所有极客一样过着简单的生活。那个时候打工与学习几乎占据了她所有的时间。李飞飞明白,这就是普通新移民的生活,需要点牺牲和决心。幸运的是她的同学和高中数学老师在这时给了她莫大鼓励和帮助。


1995 年,李飞飞进入普林斯顿大学攻读物理学,生活的大门终于渐渐为她打开。在周一到周五,她是普林斯顿物理系拿着高额奖学金的高材生,周末则必须回到 Parsippany 的洗衣房,置身于成堆的衣服中。她说「我爱普林斯顿。」因为这里有全世界最优秀的年轻天才。


然而生活的艰辛也在随着年龄增长,她见过斯坦福的优秀博士毕业生为一张绿卡四处奔波,那时的她不明白也无法想象一张绿卡,一个留在美国的机会能难倒全世界那么多优秀的人才。


有过移民经历的人对平等有着更加深刻的体会,李飞飞也如此,她坚持主张高科技产业性别平等,支持种族多样化,还有反对特朗普。她曾在 Twitter 上调侃特朗普是个不懂科学没有眼界的人。


李飞飞说:「多样化的危机,也正是我们的社会正在应对的危机。『科技是没有灵魂的吗?』」她坦承自己对 AI 研究界的失望,因为这一领域不太欢迎不具代表性的少数群体。在她工作的部门里一共有 15 名全职人员,她是唯一的女性。


梦想与责任


并不是每个美国移民都能实现自己的梦想,但李飞飞做到了。当初她随父母举家搬到大洋彼岸。「他们来到这个国家是为了追求梦想。」李飞飞认为她也「应该能够追求自己的梦想。」这个「应该与能够」的选择做起来并不轻松。


1999 年,李飞飞从普林斯顿大学毕业,那时的华尔街一片辉煌,互联网泡沫的热潮接近顶峰,李飞飞接到了多家金融公司的工作邀请。然而她却没有从中选择任何一份工作来减轻家庭经济负担。她的父母支持她做出了最后选择,去西藏研究藏医。


虽然李飞飞知道自己终将回到学校,回到科研工作中来,读博士也是她的梦想,但西藏之行并非人生插曲。


在科学界藏医与中医一样存在很多争议,但这并不妨碍李飞飞对它的兴趣。她在媒体采访中提到,作为一个科学家,藏医可以在哲学和方法论层面上给她给多的理解。她非常看重具体科研项目在更大领域范围内的意义,每一项研究开始之前都要经过深思熟虑。


4EFEE3A5-9BBC-4F74-8ED9-62D1A83C388B.png

她曾经放弃高盛的 offer,追随梦想来到西藏 

 

在李飞飞后来写给博士生们的信中可以看到她对科学探索的态度:


每个领域的每一篇论文都应该以独特的新视角进行研究。所以当你在机械地开展你们的工作前,请扪心自问——『我的研究会重新定义这一领域的未来吗?』这意味着发表论文的意义不是『这个方向没有人写过』,或者『让我来解决这个小问题,它的成果会很容易展示』;研究意味着『如果我做了,这一重大问题就有了更好的解决方案』,『如果我做了,我就真正开拓了这一领域』。你的研究成果应该能被很多人和行业直接使用,换句话说,你的选题应该有很多『客户』,你的解决方案应该是他们想要的。


西藏归来之后,李飞飞开始了加州理工的博士学业。博士期间母亲接连患上了癌症与中风,那是一段艰苦的日子,李飞飞说,「我们经历了很多困难,然后一起挺过来了。既要担起生活的责任,又要对得起自己的梦想」。


改变图像识别方向的人

 

是什么吸引谷歌一次性将李飞飞和她的门生李佳一齐请进公司,并委以重任的?显然是她的学术成就和影响力。


自 2009 年以来,李飞飞一直担任斯坦福人工智能实验室和斯坦福视觉实验室的负责人,并成为了终身副教授。在她 2014 年的简历上,有 95 篇在 Nature、PNAS、Journal of Neuroscience、CVPR、ICCV、NIPS 等顶级期刊与会议上发表的文章;联合发表的文章有 32 篇。从 2015 年到 2016 年,李飞飞署名发表的论文有 33 篇(斯坦福视觉实验室),还有一篇将在 2017 年发表在 CSCW 会议上。


在不就之前,艾伦人工智能研究所推出了以人工智能为基础的免费学术搜索引擎 Semantic Scholar。我们使用该引擎生成了李飞飞的论文引用量图解(注:搜索时请注意名字输入格式,Feifei Li 为另一位作者。),如下:


9FBC55BC-087E-4116-8663-8E5D2757625A.jpeg


AB56156F-ECB0-4E75-B8C5-639A444E65DB.png

过去 3 年,李飞飞论文的平均引用量为 6738。


453F5461-209B-4608-972E-BC3D323DB6F6.jpeg

基于可用数据,Semantic Scholar 估计李飞飞的引用量在 33215 到 44773 之间。


回溯过去,李飞飞在计算机视觉上的研究已经花费了 15 年。


在 2007 年,李飞飞和一位同事着手开始一项庞大的任务,为来自互联网的十亿张图片进行分类、打标签,从而为计算机提供样本。其中理论基础是如果机器观察到足够的事物,它们就能够在现实世界进行识别。


他们使用亚马逊 Mechanical Turk 这样的众包平台,邀请了来自 167 个国家的 5 万人帮助为其中的数百万张图像打标签。


最终,他们建立了 ImageNet 数据集。今天,这个数据集包含了使用日常英语标记的超过 1400 万张图像,跨越 21,800 个类别。


在我们用 Semantic Scholar 生成的图解中发现,李飞飞被引用最多的论文就是她于 2009 年在 CVPR 上发表的《ImageNet: A large-scale hierarchical image database》。


1630B249-0BB8-4355-A07A-6F2DCE2D0ABD.jpeg


F3FCA76D-06F1-42B7-9F4D-2847A51E287B.jpeg

李飞飞Ted演讲

点击查看原视频

瓜分学界人才的科技巨头们


谷歌的云业务负责人 Diane Greene 在新闻发布会上说,李飞飞和李佳的加入是谷歌正式将人工智能集团业务正式化的一部分。此后,该团队不会只专注于人工智能研究,而是致力于将尖端技术融入各种 Google Cloud 产品,例如让公司预测销售情况的软件。


而在宣布成立人工智能集团之前,谷歌还围绕着云服务部门产品路线图发布了一系列产品,介绍了他们如何扩大机器学习的使用。对于云计算来说,机器学习是一项关键的技术,它能训练大规模的 AI 网络,不断自我学习和提升。


Google Cloud 及其机器学习团队的产品经理 Rob Craft 也表示,这两名研究者将帮助谷歌「将机器学习的力量带入其他行业」,他们也将成为谷歌整合其研究单位及核心业务努力的一部分。


但是,雇用具有机器学习和相关任务专业知识的人才并不便宜。这一行业内的激烈竞争导致谷歌这样的大公司经常会支付「NFL 球员签字费」级别的巨额资金,而越来越多的顶级学界研究人员也陆续加入了大公司的怀抱。


近年来,学界内重所周知的大牛们基本被科技巨头筛了个遍,方式也是各种各样。


最初,谷歌先是收购了多伦多大学的一家初创公司 DNNResearch。但实际上,这家公司只有三个成员,Geoffrey Hinton 和他的两个刚毕业的、曾经赢得 2012 年的 ImageNet 大赛的学生——Alex Krizhevsky 和 Ilya Sutskever(现在加入了 OpenAI)。


如今被称为谷歌最成功一笔收购的 DeepMind 也是竭尽全力的在挖空英国的人工智能人才。前几日 Business Insider 的一篇文章指出,牛津大学与剑桥大学最优秀的人工智能人才一直在被科技巨头收拢。


而且在文章中重点提到,虽然微软和 Facebook 这样的美国科技巨头也正在招募牛津大学的研究生和教授,但是 DeepMind 似乎比其他的公司挖到的人才更多。DeepMind 从被谷歌收购了之后就已经把它的团队规模从在国王十字路时的 100 人扩大到了大约 250 人。


不只是谷歌,以美国、中国为主力的科技巨头们正如同「风暴之眼」一般吸纳着一切尽可能的能量推动着公司在人工智能道路上的快速发展。


微软在人工智能研究中一直处于第一梯队,在 9 月底宣布组建 5000 人规模的专注人工智能的工程和研发团队 Microsoft AI and Research Group。


之前我们觉得已然落后了的苹果,在 10 月份拉拢到了 CMU 机器学习教授 Russ Salakhutdinov 作为该公司人工智能研究的负责人,开始招聘人才、组建团队。


中国的 BAT 三巨头。百度因为有吴恩达,「声音」是最大的,我们对他们的人工智能研究也是了解最多的(开源深度学习框架 Paddle、硬件基准测算工具 DeepBench 等)。


阿里在今年的云栖大会上也「秀」了一把人工智能。


腾讯也在最近成立了腾讯 AI Lab,新一轮的招兵买马不可避免。虽然在机器之心的专访中他们对腾讯 AI Lab 没谈到太多内容,但隐隐可察觉出腾讯也要像谷歌一样在人工智能与自己的平台和产品结合上打通一条道路。


在接近尾声的 2016 年,我们已经明显感觉到人工智能、机器学习、深度学习等字眼成为了科技界的主流。从害怕 AlphaGo 之后因过度炒作而经历新一轮寒冬,到语音识别、神经机器翻译等的一个又一个的技术突破,再到越来越激烈的人才竞争,一个新的时代即将到来。



©本文由机器之心原创,转载请联系本公众号获得授权

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
8641 0
阿里云服务器ECS远程登录用户名密码查询方法
阿里云服务器ECS远程连接登录输入用户名和密码,阿里云没有默认密码,如果购买时没设置需要先重置实例密码,Windows用户名是administrator,Linux账号是root,阿小云来详细说下阿里云服务器远程登录连接用户名和密码查询方法
11007 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
11941 0
windows server 2008阿里云ECS服务器安全设置
最近我们Sinesafe安全公司在为客户使用阿里云ecs服务器做安全的过程中,发现服务器基础安全性都没有做。为了为站长们提供更加有效的安全基础解决方案,我们Sinesafe将对阿里云服务器win2008 系统进行基础安全部署实战过程! 比较重要的几部分 1.
8802 0
阿里云服务器安全组设置内网互通的方法
虽然0.0.0.0/0使用非常方便,但是发现很多同学使用它来做内网互通,这是有安全风险的,实例有可能会在经典网络被内网IP访问到。下面介绍一下四种安全的内网互联设置方法。 购买前请先:领取阿里云幸运券,有很多优惠,可到下文中领取。
11778 0
腾讯云服务器 设置ngxin + fastdfs +tomcat 开机自启动
在tomcat中新建一个可以启动的 .sh 脚本文件 /usr/local/tomcat7/bin/ export JAVA_HOME=/usr/local/java/jdk7 export PATH=$JAVA_HOME/bin/:$PATH export CLASSPATH=.
4569 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,云吞铺子总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系统盘、创建快照、配置安全组等操作如何登录ECS云服务器控制台? 1、先登录到阿里云ECS服务器控制台 2、点击顶部的“控制台” 3、通过左侧栏,切换到“云服务器ECS”即可,如下图所示 通过ECS控制台的远程连接来登录到云服务器 阿里云ECS云服务器自带远程连接功能,使用该功能可以登录到云服务器,简单且方便,如下图:点击“远程连接”,第一次连接会自动生成6位数字密码,输入密码即可登录到云服务器上。
21731 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
6628 0
1574
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载