周博磊知乎热答:如何评价何恺明大神斩获ICCV 2017最佳论文

简介: 2017年10月24日下午,Facebook AI 研究员何恺明大神斩获ICCV 2017最佳论文,这是他第三次斩获顶会最佳论文,对于Kaiming He 在 ICCV 2017 上拿下双 Best的paper,他的中大同学,另一位大神周博磊在知乎写了一段他眼中的凯明师兄。


q1

2017年10月24日下午,Facebook AI 研究员何恺明大神斩获ICCV 2017最佳论文,这是他第三次斩获顶会最佳论文,对于Kaiming He 在 ICCV 2017 上拿下双 Best的paper,他的中大同学,另一位大神周博磊在知乎写了一段他眼中的凯明师兄。

大数据文摘经周博磊授权,发布这篇文章,看看大神眼中的大神是什么样?

其实从他发Dark Channel那篇论文开始,我就挺关注他的研究工作。那时候还是前Deep Learning时代的计算机视觉,一切都还不怎么work,还流行着LDA和各种graphical models。他那几篇low-level vision的论文读完就让人有眼前一亮的感觉,很多时候论文的立意都是从现象出发,然后追溯到背后的本质,然后再提出了一个朴实有效的解决问题的办法。虽然我自己不做low-level vision,但这些论文读完让我有 “啊哈” 的欣喜感觉,受到挺大的启发。这种从现象和问题出发追溯本质的思想,给他后面更加优秀和广为人知的工作埋下了重要的伏笔。

后来恺明从中大(CUHK)博士毕业在MSRA当研究员的时候就开始领队打ImageNet比赛了,做image classification的问题。从low-level vision到high-level vision,对于一般研究者,本来是个挺大的转变。但这恰好赶上了deep learning的浪潮,如何训练更好的分类神经网络本身是个非常empirical的研究问题。神经网络太复杂了,很难有什么理论指导,所以这玩意更像一个现象。

这样,恺明之前的从现象到本质的研究方式让他发现了神经网络中很多的问题所在,并提出了一些很有效的解决办法。比如说从防治gradient vanishing问题, 导出了Parametric ReLU,以及进一步提出后来封神的ResNet。再比如针对在object detection里如何更有效地利用CNN feature map, 提出了Spatial Pyramid Networks,到后来Fast RCNN, 跟Ross一起的Faster RCNN, 以及现在获奖的Mask RCNN。你可以很清楚地看出这些优秀研究工作的连贯性。在一个研究问题上死磕5,6年,在现在这个乱花迷人眼的时代非常难得。而且这image classification and object detection是计算机视觉的核心问题,恺明能解决得如此漂亮,真是由衷佩服,对这个领域推动也是巨大的(连AlphaGo Zero都用了residual block,可以想象Resnet是如何应用到计算机视觉的研究和产品线中去的)。当然,恺明的这些研究工作有很多顶级优秀的Collaborator参与,比如说他MSRA的孙老大(现Face++),两位顶尖实习生Xiangyu Zhang, Shaoqing Ren,以及FAIR的顶尖高手Ross和Pitor等等,这里就不展开了。

恺明去年夏末的时候才从MSRA到美国来加入Facebook AI Research,一年不到就搞出了MaskRCNN这个黑武器。MaskRCNN是semantic segmentation和object detection的一个结合,成为了instance segmentation的利器。Facebook内部工程线上面都广泛部署了Resnet和MaskRCNN,想必对公司贡献是非常大的。三周前我刚去FB总部参加了一个workshop,跟他聊了些近况和新的研究方向。你们的恺明大神还是依旧战斗在coding最前线的,哈哈,我是不会透露他正在蕴酿下一个什么大招的,大家期待就是了。

最后,大家可以再留意一下ICCV'17最后一天(也就是这周末)的Workshop COCO + Places 2017 。我参与举办了这次joint challenge,比赛项目是object detection, keypoint detection, scene parsing, instance segmentation等等。一个看点是,Kaiming和Ross所在的FAIR团队如何对垒中国的一些视觉公司如Face++和SenseTime等等,比赛结果会在当天揭晓。结果挺有意思,也值得大家思考。
原文发布时间为:2017-10-26
本文作者:周博磊
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”微信公众号

相关文章
|
5月前
|
机器学习/深度学习 人工智能 算法
300多篇相关研究,复旦、南洋理工最新多模态图像编辑综述论文
【7月更文挑战第11天】复旦、南洋理工联合研究综述了多模态图像编辑,聚焦T2I扩散模型在融合多种输入模式、保持图像真实性和用户友好性方面的挑战与解决方案。论文探讨统一编辑框架,分析算法组件,指出技术进步及未来方向,同时警示伦理和社会影响。[链接:https://arxiv.org/abs/2406.14555]
54 1
|
机器学习/深度学习 存储 人工智能
不避嫌、不遮丑!陈天琦导师自批NeurIPS2018最佳论文:没那么神,问题很多
近日,陈天琦的导师David Duvenaud在NeurIPS 2019上回顾了此前获NeurIPS 2018最佳论文的研究。他表示,这篇论文从写作动机上是为了讨好前辈,在数据处理上没有对基线方法进行调参,导致结果的确定性没那么高,并对一些科技媒体的夸大和不实报道做了澄清。他不避嫌、不遮丑的坦诚态度赢得了网友的好感和敬佩。
642 0
不避嫌、不遮丑!陈天琦导师自批NeurIPS2018最佳论文:没那么神,问题很多
|
数据可视化 数据挖掘 大数据
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(2)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
190 0
|
机器学习/深度学习 达摩院 算法
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(1)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
108 0
|
机器学习/深度学习 存储 算法
顶会最强的前20%!电影情感效应预测论文拿下ACMMM Oral收录!
顶会最强的前20%!电影情感效应预测论文拿下ACMMM Oral收录!
237 0
|
机器学习/深度学习 人工智能 自然语言处理
CVPR 2021大奖公布!何恺明获最佳论文提名,代码已开源!
深度生成模型可以在高分辨率下进行逼真的图像合成。但对于许多应用来说,这还不够:内容创作还需要可控。虽然最近有几项工作研究了如何分解数据中的潜在变化因素,但它们大多在二维中操作,忽略了我们的世界是三维的。
CVPR 2021大奖公布!何恺明获最佳论文提名,代码已开源!
|
机器学习/深度学习 存储 人工智能
SIGIR 2022 | 推荐系统相关论文分类整理(一)
SIGIR 2022 | 推荐系统相关论文分类整理(一)
1871 0
SIGIR 2022 | 推荐系统相关论文分类整理(一)
|
机器学习/深度学习 存储 人工智能
NeurIPS 2020奖项出炉:GPT-3等三项研究获最佳论文奖,华人一作论文获时间检验奖
一万八千人参会的NeurIPS 2020 相比去年数量暴涨了三成,在大会上,1750 亿参数模型 GPT-3 再次成为了人们热议的话题。
198 0
NeurIPS 2020奖项出炉:GPT-3等三项研究获最佳论文奖,华人一作论文获时间检验奖
|
机器学习/深度学习 vr&ar 图形学
CVPR 2020华人一作包揽最佳论文、最佳学生论文,中国作者占39%,清华高居第一
机器之心编辑部 在刚刚开幕的 CVPR 2020 上,最佳论文、最佳学生论文等奖项悉数公布,来自牛津大学的吴尚哲等人获得了最佳论文奖,本科毕业于上海交通大学、现为西蒙弗雷泽大学博士一年级学生 Zhiqin Chen 等人获得最佳学生论文。
257 0
CVPR 2020华人一作包揽最佳论文、最佳学生论文,中国作者占39%,清华高居第一
|
算法 数据挖掘 知识图谱
CIKM'2017 最佳论文鉴赏
今年的Best Paper Award由清华大学的李国良老师团队获得,论文题为:Hike: A Hybrid Human-Machine Method for Entity Alignment in Large-Scale Knowledge Bases《一种基于人机协作的大型知识图谱对齐方法》. 因为是Best Paper,本篇分享单独对该文章做细致解读。
4116 0
下一篇
DataWorks