年度计算机视觉和模式识别盛会CVPR(Conference on Computer Vision and Pattern Recognition)在美国盐湖城开幕啦!
据统计,本届大会有超过3309篇大会论文投稿,接收979篇论文。
面对如此多的论文评审任务,CVPR 2018 采用了多线程多论文并行的模式,最后颁布了五大奖项,分别是:最佳论文、最佳学生论文、提名论文、PAMI年轻学者奖、PAMI Longuet-Higgins Prize。
Tübingen大学教授Andreas Geiger与Facebook研究科学家何恺明获得本届大会的PAMI年轻学者奖。
最佳论文
最佳论文的获得者来自斯坦福大学和加州伯克利大学,他们分别是:Amir R. Zamir, Alexander Sax, William Shen, Leonidas J. Guibas, Jitendra Malik, Silvio Savarese。
这篇文章定义了一个新的任务,针对在视觉内的迁移学习,并提出了一个非常大的数据库,定义的任务是这样的:视觉任务类目很多,只针对某个问题来解决的话,会需要很大的标注的数据集,所以一个视觉任务的解决应该能够一定程度的解决另一个视觉任务,毕竟一个成熟模型的构建意味着对该图像的一定的理解,而这部分的理解的一部分或许对另一个任务有助益,例如,物体之间的相互联系对深度信息的学习毫无疑问有帮助。
最佳学生论文
最佳学生论文的获得者来自卡内基梅隆大学的Hanbyul Joo以及 Facebook Reality Labs的Tomas Simon和Yaser Sheikh。
这篇题为《完全捕捉:一个用于追踪脸、手、身体姿态的3D变形模型》论文提出了一种统一的变形模型,可以全方位捕捉人体的运动,包括面部表情和手势等等。论文中也提出“Frank”的概念,即人类身体不同部位分别的建模结果局部拼合起来就生成了一个初始模型。
此模型可以通过一个无缝的模型对身体各个部位的动作进行充分的表达,包括面部和手部。论文作者还建立了数据集,其中包含了人们日常着衣的数据,并对Frank模型进行了优化,得到Adam,这是一个经过校准的模型,它和最初的Frank模型具有同样的结构层次,但该模型具有简单的参数。最后,论文作者对模型的效果进行了展示,它可以同时捕捉一群人的大尺度身体动作以及微小的脸部和手部动作。
提名论文
共四篇,分别是:
Deep Learning of Graph Matching
作者:Andrei Zanfir, Cristian Sminchisescu
这篇文章提出了一个端到端的深度学习模型,它可以学习图形匹配过程的所有参数,包括一维和成对的节点邻域,表现为为深度特征提取层次结构。
SPLATNet: Sparse Lattice Networks for Point Cloud Processing
作者:Hang Su, Varun Jampani, Deqing Sun, Subhransu Maji, Evangelos Kalogerakis, Ming-Hsuan Yang, Jan Kautz
本文提出了一个处理点云的网络体系结构,该体系结构直接作用于高维格中稀疏样本点的集合。
CodeSLAM — Learning a Compact, Optimisable Representation for Dense Visual SLAM
作者:Michael Bloesch, Jan Czarnowski, Ronald Clark, Stefan Leutenegger, Andrew J. Davison
本文提出了一种新的场景几何学的紧凑而密集的表示,它以单个图像的强度数据为条件,由一个少量参数组成的代码生成。
Efficient Optimization for Rank-Based Loss Functions
作者:Pritish Mohapatra, Michal Rolínek, C.V. Jawahar, Vladimir Kolmogorov, M. Pawan Kumar
本文提出了一种新的快速排序算法,用于求解一类不可分解的损失函数。
原文发布时间为:2018-06-20
本文作者:文摘菌