二十年来第一次!CVPR最佳学生论文授予中国高校学生

简介: 二十年来第一次!CVPR最佳学生论文授予中国高校学生


近日,全球人工智能领域最具影响力的大会CVPR宣布,将2022年“最佳学生论文”奖颁给同济大学研二学生陈涵晟等人,这是二十多年来首次有中国高校学生获此殊荣。


陈涵晟是阿里达摩院的“研究型实习生”,该论文是陈涵晟在实习期间的成果,融合了传统几何推理和深度学习,提出了计算3D物体位姿的新方法,能从单张图片计算出3D物体在真实世界里的位置和朝向,有望成为自动驾驶、机器人等技术发展的理论动力。


获奖证书


CVPR(国际计算机视觉与模式识别会议)是人工智能领域的顶级学术会议,今年共收到8161篇论文投稿,最终录取2064篇,只评出最佳论文和最佳学生论文各1篇。


CVPR的最佳论文和最佳学生论文常被视作AI技术风向标,诞生了ResNet等一系列标志成果。


早在2001年,CVPR就设立了最佳学生论文奖,今年首次发给中国高校学生。


获奖论文《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation 》来自同济大学汽车学院和阿里巴巴达摩院,作者分别是陈涵晟、王丕超、王帆、田炜、熊璐、李昊。


论文研究的是3D视觉领域经典问题——通过单张图像求解3D物体在真实世界里的位姿(位置和朝向)


这一技术方向应用前景广阔,是自动驾驶、机器人等行业的基础技术。比如在自动驾驶中,只有先计算出周边车辆的位姿,判断对方究竟是要加速、刹车还是变道,己方车辆才能做出对应操作,计算不准或者过慢都有可能引发事故。


3D物体的位姿计算示意


通过单张图像定位3D物体极具挑战性。一般有两类解决方法:


一类是基于几何推理,例如PnP算法,可解释性好、泛化能力强,但需要提前知道物体的尺寸和形状,具有较大的局限性;

另一类是深度学习方法,可预测3D物体的位置坐标和朝向角度,但在小规模数据集上容易过拟合。


获奖论文提出的新方法EPro-PnP,创造性地引入概率分布,将几何推理和深度学习两种方法无缝衔接,形成了一个端到端的易用模型,可以快速估算3D物体的位姿。


实验证明,新模型通用性强、定位准确,不需要提前知道物体的几何形状;更重要的是非常简洁,效率较高,且具有较好的可解释性,有望用于自动驾驶、机器人、无人机、AR等诸多需要通过视觉来估算物体位姿的场景。


EPro-PnP方法示意


论文第一作者陈涵晟本硕都就读于同济大学汽车学院,目前研究生二年级在读,导师为熊璐教授,副导师为田炜助理教授,达摩院导师为王丕超博士。他的研究方向是计算机视觉中的3D物体位姿估计,研一就已在CVPR发表论文。


2021年陈涵晟到阿里达摩院做研究型实习生后,在达摩院日常研究讨论中碰撞出灵感,尝试去构造统一的理论框架。


达摩院研究型实习生、同济大学研究生陈涵晟


论文第一通讯作者、达摩院算法专家王丕超博士表示,这篇论文特别之处在于,用数学的方式解决AI底层问题,带来了基础理论上的突破,对3D视觉领域的研究和应用都将产生积极影响。


“核心创新是转换数学视角,引入概率密度,把不可导的函数变成可导,所以能通过反向传播来训练深度网络,最终实现稳定收敛,提升3D物体的定位精度。”


2017年,阿里巴巴启动了“研究型实习生”计划,为海内外高校学生提供场景、资源、补助等支持,帮助青年学子开拓科研视野、实现学术目标。


目前,全球已有200多所高校的1000多名学生参与该项目,并成功收获属于他们的科研果实。


2022“研究型实习生”仍在招募中,面向海内外高校学生开放了200多个科研选题,涵盖量子计算、自动驾驶、人工智能、网络安全等数十个方向,入选者将获得阿里的科研支持,并与达摩院、阿里云等团队合作探索前沿技术。



/ END /


目录
相关文章
|
人工智能 自然语言处理
ACL 2023奖项公布:3篇最佳论文、39篇杰出论文,多家国内机构上榜(2)
ACL 2023奖项公布:3篇最佳论文、39篇杰出论文,多家国内机构上榜
205 0
|
机器学习/深度学习 人工智能 自然语言处理
ACL 2023奖项公布:3篇最佳论文、39篇杰出论文,多家国内机构上榜(1)
ACL 2023奖项公布:3篇最佳论文、39篇杰出论文,多家国内机构上榜
384 0
|
机器学习/深度学习 人工智能 自然语言处理
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
330 0
|
机器学习/深度学习 编解码 网络协议
创历届最好成绩!阿里云6篇论文入选顶会SIGCOMM2022
创历届最好成绩!阿里云6篇论文入选顶会SIGCOMM2022
314 0
|
数据可视化 数据挖掘 大数据
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(2)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
204 0
|
机器学习/深度学习 达摩院 算法
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(1)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
128 0
|
机器学习/深度学习 传感器 人工智能
同济、阿里获CVPR最佳学生论文,李飞飞获黄煦涛奖,近6000人线下参会(2)
同济、阿里获CVPR最佳学生论文,李飞飞获黄煦涛奖,近6000人线下参会
175 0
|
传感器 测试技术 计算机视觉
同济、阿里获CVPR最佳学生论文,李飞飞获黄煦涛奖,近6000人线下参会(1)
同济、阿里获CVPR最佳学生论文,李飞飞获黄煦涛奖,近6000人线下参会
165 0
|
机器学习/深度学习 人工智能 自然语言处理
商汤的数字人研究,在CVPR上成了爆款
在 CVPR 大会上,看数字人技术的最新趋势。
741 0
商汤的数字人研究,在CVPR上成了爆款
|
机器学习/深度学习 编解码 网络协议
创历届最好成绩 阿里云6篇论文入选全球网络顶会SIGCOMM2022
8月29日消息,国际权威网络顶会SIGCOMM2022近日在荷兰举行,55篇顶级学术成果出炉,阿里云共计有6篇高质量论文被主会收录,占总数10%以上,创下了国内历届参会企业的最好成绩,同时力压谷歌、微软等巨头,成为本届入选论文最多的科技公司。入选的论文包括阿里云自研的下一代高性能RDMA网络协议Solar、端网融合可预期数据中心网络架构、可编程网络稳定性保障系统等。
334 0