实习博士访谈:我终于拥有了在大学实验室梦寐以求的算力

简介: 正在谷歌实习的慕尼黑工业大学博士在读生 Philip Haeusser 的研究领域是计算机视觉。在这篇访谈中,他谈到了自己在谷歌的实习项目、经历、收获以及如何处理实习和自己博士研究课题的关系。 给我们介绍一下你自己,还有你的博士研究课题吧。


image

正在谷歌实习的慕尼黑工业大学博士在读生 Philip Haeusser 的研究领域是计算机视觉。在这篇访谈中,他谈到了自己在谷歌的实习项目、经历、收获以及如何处理实习和自己博士研究课题的关系。

给我们介绍一下你自己,还有你的博士研究课题吧。

我是 Philip,慕尼黑工业大学博士研究生三年级在读,师从 Daniel Cremers。我的研究领域为计算机视觉,即教计算机理解图像及视频的学科。对于计算机而言,图像及视频只不过是巨大数量的无意义数字的组合。如果把它们以色彩表现出来,人类则很容易分辨图片中的内容。

image
Philip Haeusser

为了教会计算机做同样的事情,我训练神经网络,即一组可以被理解为是“迷你视觉皮层”的模型。目的是为了将组成图像的数字赋予某种意义,如“猫”这样的标签。神经网络在这方面表现惊人。我研究的问题包括光流(从视频的一帧是如何切换到下一帧的)以及域适配(如何使用将一种域的标签,如手写体的图像,运用到另一种域,如谷歌街景里的门牌号)等。

研究以外的时间,我会在我自己的 YouTube 频道“Phil’s Physics”上演示一些实验和分享一些科学知识。

你是如何进入这个领域的呢?

我于2014年在加州大学圣克鲁兹分校获得物理专业硕士学位。当时我在一个跨学科研究小组里参与盲人视网膜移植的项目。我们所做的实验之一需要处理大量的数据,这些数据都非常昂贵,但还无法全部被我们所使用,因为我们的数据处理程序不够复杂。我就是在那时起开始涉猎机器学习和神经网络。我立即被深深吸引并开始联系相关领域的教授。我非常荣幸向 Daniel Cremers 展示了我的工作,并在之后开始读他的博士。

你为什么要来谷歌实习,你的导师是否支持?

深度学习领域发展速度迅猛。几乎每周都有一篇有关神经网络或训练技巧的突破性的新论文发表,而论文作者多来自谷歌,这就使得我对于谷歌在这一领域所做的工作充满了兴趣。在一次夏校的课程里我遇到了 Oliver Bousquet,他对谷歌大脑团队的描述令人惊叹。他也提到了谷歌的实习项目,我立即就申请了。我的导师对此非常支持,能够获取不同的见解,认识更多的人,进行更多的交流总是好的,尤其是在深度学习这样一个全新的领域。此外,在许多大学里计算力无法达到的实验在谷歌都可以获得相关资源并得以完成。

你的实习项目是什么?

我有幸与 DeepDream 创始人之一 Alexander Mordvintsev一起工作。所做的项目涉及用未标记数据和半监督学习训练神经网络的新方法。

我们开发了一种我们称之为“关联学习”的新方法。这有点儿类似“关联游戏”,你听到一个词并马上说出你想到的第一个与之有关联的词。几次“迭代”之后得到的“关联链条”通常出人意料。

我们做的事情非常类似:我们训练一个神经网络来产生允许关联的表征(神经激活模式),关联指标记数据及未标记数据之间的关联。想象从标记数据组中的一个样本到未标记数据组中的另一个样本之间建立一条关联链条;之后,从未标记组到标记组中再建立一条关联,这就形成了一个关联循环。我们就可以将最后得到的样本标签与循环开始时的样本标签做对比。我们的目标在于建立连续一致的关联循环,意指标签是一致的。我们将其表达为成本函数,并证明了该技术对于使用少量标签数据来练分类网络非常有效。

你在谷歌实习期间有发表论文吗?

有的,我完成了一篇论文并提交了 CVPR,在2017年 CVPR 大会上还发表了这篇论文。谷歌资助了我参会的费用。所以在谷歌的实习不仅大幅增长了我在产业里的阅历,还帮助我产出了一篇我自己引以为傲的论文。

你的实习经历与你的博士研究课题相关性如何?

实习之初我们探寻了很多课题,后来从事的这一个与我的博士研究课题非常契合。事实上,我认为即便是参与一个与博士课题并非直接相关的实习项目也会受益良多,例如在编程及项目管理等方面得到的能力训练。

你自己写代码吗?

多亏代码复查,我得以提高了编码水平以及对代码风格及可拓展性有更多考量。谷歌也支持我将自己的代码开源,这也是研究领域惯常的做法。我因此得以继续我的工作,以及同时与全球的研究者分享代码。我还完成了一篇后续论文,关于“关联域适应”,这篇论文也刚被 ICCV 所接受。

这是你第二次在谷歌实习。为什么又回到谷歌苏黎世办公室?

谷歌有太多吸引人的研究项目了,一次实习完全不够,哈哈!说正经的,Sylvain Gelly 的小组邀我参与一个非常有趣的项目。我在去年见过他本人及他的团队,他们都是非常牛的人,我一定不会错过与他们共事的机会。

你在谷歌实习期间获取的最重要的技能是什么?

我认为我的编码能力提高了很多。在谷歌,你有机会向很多超一流的程序员学习,他们的编码质量高,速度快,他们还会帮你提高。与此同时,我还得以与很多不同背景的不同研究小组的成员交流。我遇到的一个产品经理在如何设计成功的产品方面给我很大启发。我还与他们一起参与了 YouTube 新特性的工作。我还在谷歌的健身中心里与 Tough Mudder 的成员一起锻炼了耐力。

实习经历对你的博士研究有何影响?

回顾过去的实习经历,这是我读博经历中重要的里程碑。我当初申请实习也并不是想获得学业的巨大转折或者怎样,不过我返回学校时确实已经收获了非常多的想法和灵感。

回顾过去的经历:博士在读生为什么要申请谷歌的实习?有任何建言吗?

攻读博士期间,有时你会感到困在原地,想要接触不同的东西;有时你想做的实验需要 1000 个GPU;有时你觉得自己已经无所不知,想要挑战自己;有时你想象自己读完博士后的生活,非常想体会狂写代码和对别人产生巨大影响是种什么感觉。理由太多了。谷歌是个允许自我尝试的地方,也许等你回家时,你已经完成了一篇很棒的论文,结交了一群好友,带着一大堆新点子,甚至获得了宝贵的工作机会。

原文发布时间为:2017-08-31
作者:Philip Haeusser
编译:熊笑
本文来自云栖社区合作伙伴“新智元”,了解相关信息可以关注“新智元”微信公众号
原文链接

相关文章
|
Windows
Window winget 包管理工具安装踩坑记录
Window winget 包管理工具安装踩坑记录
919 0
|
安全 前端开发 Windows
EACCES: permission denied,mkdir … npm install 安装依赖问题解决
可是我们看到上面的提示发现,报的是permission denied,这就很奇怪,为什么我是root用户了,还会没有权限呢?
EACCES: permission denied,mkdir … npm install 安装依赖问题解决
基于若依ruoyi-nbcio支持flowable流程增加自定义业务表单(三)
基于若依ruoyi-nbcio支持flowable流程增加自定义业务表单(三)
751 1
|
Ubuntu Linux 网络安全
Linux服务器上安装软件
Linux服务器上安装软件
443 2
|
Ubuntu Java Linux
如何检查 Java 版本是否兼容
要检查Java版本是否兼容,可在命令行输入“java -version”查看当前安装的Java版本,然后对比目标应用所需的Java版本,确保其满足要求。
1060 1
|
边缘计算 物联网 开发者
2024年提升开发效率的十大技巧
2024年,软件开发领域持续快速发展,新技术和工具层出不穷。本文总结了十大提升开发效率的技巧,包括精通Git Hooks自动化流程、利用Docker容器化技术、拥抱无代码/低代码平台、集成AI/ML、关注IoT、重视网络安全、采用云原生开发和微服务架构、探索边缘计算、利用AR和即时应用技术,以及参与开源软件项目。这些技巧旨在帮助开发者适应技术变革,提高工作效率。
|
敏捷开发 安全 Java
论软件维护方法及其应用
【11月更文挑战第16天】在软件开发的整个生命周期中,软件维护阶段占据了超过60%的时间。本文旨在深入探讨软件维护方法及其应用,通过笔者参与的一个实际Java项目为例,详细阐述软件维护的重要性、影响因素以及具体实践。
443 1
|
存储 缓存 API
深入理解RESTful API设计原则
【10月更文挑战第28天】 在现代软件开发中,RESTful API已经成为了前后端分离架构下不可或缺的一部分。本文将探讨RESTful API的核心设计原则,包括资源导向、无状态性、统一的接口以及可缓存性等关键概念,并通过实例解析如何在实际应用中遵循这些原则来设计高效、可扩展的API。我们将深入了解REST架构风格的理论基础,并讨论其对提升系统互操作性和简化客户端实现的重要性。
329 3
|
存储 边缘计算 运维
光纤收发器:连接数字世界的桥梁
【10月更文挑战第22天】
724 2
|
消息中间件 SQL API
TDengine 数据订阅 vs. InfluxDB 数据订阅:谁更胜一筹?
在时序数据的应用场景中,数据的实时消费和处理能力成为衡量数据库性能和可用性的重要指标。TDengine 和 InfluxDB 作为时序数据库(Time Series Database)中的佼佼者,在数据订阅方面各有特点。但从架构设计、灵活性和系统负载上看,TDengine 提供了更加全面且高效的解决方案。
348 2