AI大咖专访丨阿里靖世:博士的研究同样可以在工业界做,更可以影响亿万人的生活!

简介:

盖坤,花名靖世,阿里巴巴资深算法专家。

如果他从办公室的过道中走过,常常会引起周围女生的侧目。

他可是某年阿里妈妈团队女神公选的四大男神之一,在他的粉丝后援会里,横跨20岁出头刚毕业的少女粉和40多岁的风韵犹存的亲妈粉!

加入阿里之前,他是一位清华大学的博士生,期间主攻机器学习和计算机视觉的研究。

他的专研精神从那时开始一直弥漫。

博士期间,他在国际顶尖期刊和会议(包括TPAMI,NIPS,CVPR,AAAI等)上发表多篇学术论文,还获得了中国人工智能协会优秀博士论文奖。

2011年毕业后加入阿里巴巴,从事广告和推荐系统中的算法研究,带领团队提出了大规模非线性学习算法,在多个广告和推荐场景获得显著效果提升;组建了阿里妈妈图像团队,在Logo检测、OCR等关键任务上获得了效果突破,在商品审核和商品投放中发挥了重要作用。目前负责阿里妈妈精准展示技术部。
如果你有机会和他一起吃饭,他一定会饶有兴致地把餐桌上的蔬菜都为你讲解一遍。

“你知道吗,油麦菜和莴笋其实来自于同一种植物,只不过前者是叶用,后者是茎用。”

image

在同学们面临毕业抉择的当下,我们为大家采访了这位可爱的博士,他分享了作为一名博士生,从毕业择业到进入工业界的经历,相信对大家会有很多借鉴意义。


从学术界到工业界的选择

提问:当时在毕业的时候,在选择择业机会的时候,有哪些考虑?

靖世:当时其实主要考虑的有两点吧:一是希望做一些研究跟应用结合的东西。我在学校的时候,主要是做研究工作,会觉得这个对世界的影响有点不是那么直接。然后就想做一些应用工作,但也不想做那种纯应用,一点研究性质都没有,不想把自己的积累和兴趣断掉。
第二是想看看这里面的平台跟空间有多大。当时正好阿里巴巴在开始组建机器学习系统跟平台,而且阿里本身的平台跟业务空间特别广,会觉得在这里面研究跟应用能够达到一个平衡跟结合,所以这是当时的考虑。

提问:什么时候开始接触阿里,为什么加入阿里?

靖世:当时阿里在清华做宣讲的时候,我当时没去,我同学去了,说问了之后说没有这方面(AI方面)的需求,所以后面就没考虑了。偶然有一次,当时铁相(后来成了我的主管)在学校的论坛,当时叫水木清华,发了一个招聘帖子。帖子说阿里在做的一个大规模的机器学习的东西,然后就去聊了一下。
当时其实已经聊过MSRA跟IBM CRL了,原本主要看的是这类研究院,觉得从学术界到研究院可能会稍微平滑一点。但是我也了解到他们在应用方面并不是很顺畅,也会担心研究院跟学校区别不大,反而不一定有学校纯粹。

跟铁相聊完后,发现阿里在机器学习上有很强的决心,业务对这块的需求也特别强烈,这会驱使公司持续投入。而且整个业务体量特别大,可以支撑很多技术研究和应用,一个研究跟应用能够平衡结合得比较好的地方。

当时可能宣讲会上并没有一个主管能够去描绘清楚这条道路,铁相对这方面人才的要求、未来的发展等等都说得很清楚,就是这个契机吧。


博士的挑战与优势

提问:加入到阿里之后,从学生到正式的员工,从纯研究到研究和应用相结合,这个过程有没有遇到什么问题,不适应的地方,怎么解决的?

靖世:会有一些。其实我加入阿里的时候,除了带着知识,其它什么也没有,更不用谈一些现成的解决方案。所以第一段时间,应该说小半年吧,主要就是熟悉环境、业务特性、数据特性,以及从技术到应用的流程。

这期间有点不知道自己的价值在哪,对应用没那么熟,自己的知识储备跟这边的业务、数据也还找不到到结合点。但是这小半年其实一直在思考技术方面的解决方案,对一些重点的项目,研究这里面到底有什么问题困住了应用的效果。这段时间可能需要沉住气,而且需要持续的思考,把这个阶段渡过去。

提问:在这个过程当中有没有你的主管或者同事给到你一些帮助,让你能够缩短这个过程?

靖世:我当时的几任主管以及业务合作方的leader,对我的帮助和影响蛮大的。他们比我更了解真正在Work的业务背后的技术是怎么运转的,什么东西比较关键,什么东西会有比较大的影响,我们会经常一起讨论;

我经常会提出一些想法,有些不靠谱,有些靠谱,他们往往持一个非常鼓励的态度,对一些跟传统方法不一样的点,会跟我讨论,这个我觉得其实对一个新人非常受用。

我记得当时提了一个新的机器学习算法,提出来之后,大家讨论的时候有一大堆质疑,它Work不Work,能不能够收敛等等。然后我的主管觉得,那些问题在做出来之前不能完全讨论清楚。但是他看到了这个新算法的潜力,他觉得我可以去试一试,后来整个大家的疑问也是在一次次迭代的尝试中慢慢打消的。刚开始其实问题比潜力更多,如果不看潜力只说问题的话,可能这个事情就结束了。

提问:你在阿里其实也做了很多事情,能不能讲讲你觉得成就感比较高的事情?

靖世:到阿里之后,前期其实是在做一些新的机器学习算法跟模型的开发,然后也是希望这些算法跟模型能够赋能业务,在业务里面取得更好的效果。我在前期开发了一个叫分辨线性模型MR的算法,这个算法在多条业务线都变成了主力模型,为其中的机器学习应用和业务效果的持续增长做了很大的贡献,这个是前几年持续在做,持续在优化并且细化,做完整的一个事情。

这两年做的是深度学习平台跟深度学习算法的一些开发。深度学习上面如何跟互联网数据进行结合还是有很多挑战性课题的,我们也是做了一些工作有了一些成果,也对外公开了。团队其实在这方面还有非常多的积累,下一步也是希望这些东西能够跟业界进行更多交流。

提问:从一名校招生成长为资深专家,你觉得博士的经历对你的工作有什么影响?

靖世:我感受到最大的帮助是两个:第一是对韧性的锤炼。读博的时间一般是比较长的,通往毕业的道路大多数都不是一帆风顺的,不管你发论文顺不顺利,毕业这件事总是会面临某些坎坷。博士对我的影响除了知识,最大的大概就是培养了韧性和沉得住气的精神。很多时候一件事不能马上够到结果的时候,或者做到比一般人更大一点的时候,都需要非常强的坚持跟韧性在里面。

第二是科学素养方面。机器学习相关的理论跟一些算法的研究方法,用严谨的科学去看待问题的态度,这些对工作会有直接的帮助。我觉得偏理论方面的底子,在工作期间其实是挺难补的,反到是偏方法层面的东西在工作期间还可以快速地学习到。

提问:你当初的博士同学们现在都在做什么?和他们相比,你觉得现在的你有什么不同?

靖世:实验室因为是机器学习方向,所以他们大部分都是在机器学习相关的工作上,基本上以我这届为分界点,之前的可能更多的在研究机构,之后的更多的在工业界。跟在研究院的同学相比,可能我在真正解决实际问题、在应用场景中实现结果的能力上会突出一些。


工业界或许有更广阔的天地

提问:怎么看待现在很多学术界的人才加入工业界?

靖世:我觉得这是一个趋势吧,是一个很好的时机,工业界的应用跟学术界的最新进展其实是结合的,尤其在机器学习方向的结合前所未有的紧密。也说明目前的研究已经到了一个能应用或者潜在能应用的临界点,所以工业界特别关注,学术界的资源也在加快跟工业界结合。

而且两者之间的界限会越来越窄,这种研究跟创新性的工作并不局限于在学术界做,甚至更多的已经转到工业界了,因为工业界需求很强,舞台也比较大。工业界能提供的研究资源,比如数据、计算能力也会更强。

对于学术界转移到工业界的同学,可能有个挑战是要先摸清楚业务跟应用,摸清楚之后才能很顺畅的把这种研究结果和研究能力注入到实际的业务里。

提问:你觉得从你团队,或者说整个阿里,具备什么样素质的博士生才能够更好地加入阿里,去做一些事情?

靖世:我是觉得可能是需要有一个比较好的一个专业底子,然后在方法上有创新的精神,创新跟钻研的精神,对业务跟应用要有比较强的兴趣。这三点都具备的话,我认为是一个比较好的一个博士生。这样的同学会更快适应工业界,也更容易出类拔萃!

提问:哪些岗位或领域里面,阿里急需博士的加入?

靖世:我看到的主要是机器学习、NLP、图形图像、语音交互、运筹优化等人工智能方向,阿里这方面的投入、业务场景会越来越大,然后对结果的期待也会很大,我们在这块急需的人才,包括资深的研究人员跟刚毕业的博士生。当然我们我们在研发类岗位上,也需要博士的加入。

提问:对于即将面临毕业的博士生,你有什么建议?

靖世:建议就是如果找工作的话,可以尝试一下研究跟应用结合得比较好的地方,或许未来的发展空间会更广泛。在未来的工作上,希望他们一样要有坚韧跟坚持的精神,要能够去渡过一些临时的挫折,长期保持钻研跟创新的精神。要能脚踏实地,能沉得住气,能够坚持跟坚韧,但是内心又要保持追求卓越的精神。

提问:如果让你给阿里的博士生招聘打个广告,你会怎么说?

靖世:阿里巴巴其实可以说是一个数据公司,我们在数据搜集、数据应用方面持续投入了非常大的资源。因为我们的业务涉及了人们工作和生活的方方面面,这些业务每天都在产生大量数据。

我们其实拥有着世界上最大的数据场景,我们还有世界最大的market place。了解机器学习和人工智能的人都知道,一个是数据,数据决定了特征或者你怎么玩;一个是market place,里面很多点其实是Label。所以在数据跟目标两方面,都比较全的是阿里巴巴。

而这些数据的价值发挥,需要仰仗背后的算法跟人工智能,而每个方面的数据的价值,如果发挥出来,可以推动社会方方面面的进步,这里面的舞台和空间是巨大的。

image
image

来源:阿里巴巴招聘
原文链接

相关文章
|
6月前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
2521 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
11月前
|
机器学习/深度学习 人工智能 编解码
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。
2192 9
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
|
6月前
|
人工智能 数据处理 云栖大会
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
789 9
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
|
9月前
|
机器学习/深度学习 人工智能 文字识别
UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究
近年来,人工智能快速发展,大语言模型(LLM)在数学、代码等领域展现出强大的推理和生成能力,正在被广泛应用于各种场景。
308 0
|
5月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
964 1
|
人工智能 大数据 安全
拔俗AI临床大数据科研分析平台:用智能技术加速医学研究新突破
AI临床大数据科研平台基于云原生架构,融合医疗NLP、联邦学习与智能分析技术,破解非结构化数据处理难、多源数据融合难、统计周期长等痛点,实现数据治理、智能分析与安全协作全链路升级,赋能医学科研高效、安全、智能化发展。
237 0
|
8月前
|
人工智能 搜索推荐 API
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
|
7月前
|
机器学习/深度学习 数据采集 人工智能
阿里开源即封神,一上线就斩获4000+ star背后的真相,WebAgent多步骤智能网搜神器,颠覆你对AI的信息检索印象!
WebAgent 是阿里巴巴开源的多步骤智能网搜神器,包含 WebWalker、WebDancer、WebSailor 等模块,支持复杂推理与长上下文信息检索,GitHub 已获 4.7k star,颠覆传统 AI 搜索方式。
948 1
|
8月前
|
机器学习/深度学习 人工智能 自动驾驶
AI Agent多模态融合策略研究与实证应用
本文从多模态信息融合的理论基础出发,构建了一个结合图像与文本的AI Agent模型,并通过PyTorch代码实现了完整的图文问答流程。未来,多模态智能体将在医疗、自动驾驶、虚拟助手等领域展现巨大潜力。模型优化的核心是提升不同模态的协同理解与推理能力,从而打造真正“理解世界”的AI Agent。
AI Agent多模态融合策略研究与实证应用