AI大咖专访丨阿里靖世:博士的研究同样可以在工业界做,更可以影响亿万人的生活!

简介:

盖坤,花名靖世,阿里巴巴资深算法专家。

如果他从办公室的过道中走过,常常会引起周围女生的侧目。

他可是某年阿里妈妈团队女神公选的四大男神之一,在他的粉丝后援会里,横跨20岁出头刚毕业的少女粉和40多岁的风韵犹存的亲妈粉!

加入阿里之前,他是一位清华大学的博士生,期间主攻机器学习和计算机视觉的研究。

他的专研精神从那时开始一直弥漫。

博士期间,他在国际顶尖期刊和会议(包括TPAMI,NIPS,CVPR,AAAI等)上发表多篇学术论文,还获得了中国人工智能协会优秀博士论文奖。

2011年毕业后加入阿里巴巴,从事广告和推荐系统中的算法研究,带领团队提出了大规模非线性学习算法,在多个广告和推荐场景获得显著效果提升;组建了阿里妈妈图像团队,在Logo检测、OCR等关键任务上获得了效果突破,在商品审核和商品投放中发挥了重要作用。目前负责阿里妈妈精准展示技术部。
如果你有机会和他一起吃饭,他一定会饶有兴致地把餐桌上的蔬菜都为你讲解一遍。

“你知道吗,油麦菜和莴笋其实来自于同一种植物,只不过前者是叶用,后者是茎用。”

image

在同学们面临毕业抉择的当下,我们为大家采访了这位可爱的博士,他分享了作为一名博士生,从毕业择业到进入工业界的经历,相信对大家会有很多借鉴意义。


从学术界到工业界的选择

提问:当时在毕业的时候,在选择择业机会的时候,有哪些考虑?

靖世:当时其实主要考虑的有两点吧:一是希望做一些研究跟应用结合的东西。我在学校的时候,主要是做研究工作,会觉得这个对世界的影响有点不是那么直接。然后就想做一些应用工作,但也不想做那种纯应用,一点研究性质都没有,不想把自己的积累和兴趣断掉。
第二是想看看这里面的平台跟空间有多大。当时正好阿里巴巴在开始组建机器学习系统跟平台,而且阿里本身的平台跟业务空间特别广,会觉得在这里面研究跟应用能够达到一个平衡跟结合,所以这是当时的考虑。

提问:什么时候开始接触阿里,为什么加入阿里?

靖世:当时阿里在清华做宣讲的时候,我当时没去,我同学去了,说问了之后说没有这方面(AI方面)的需求,所以后面就没考虑了。偶然有一次,当时铁相(后来成了我的主管)在学校的论坛,当时叫水木清华,发了一个招聘帖子。帖子说阿里在做的一个大规模的机器学习的东西,然后就去聊了一下。
当时其实已经聊过MSRA跟IBM CRL了,原本主要看的是这类研究院,觉得从学术界到研究院可能会稍微平滑一点。但是我也了解到他们在应用方面并不是很顺畅,也会担心研究院跟学校区别不大,反而不一定有学校纯粹。

跟铁相聊完后,发现阿里在机器学习上有很强的决心,业务对这块的需求也特别强烈,这会驱使公司持续投入。而且整个业务体量特别大,可以支撑很多技术研究和应用,一个研究跟应用能够平衡结合得比较好的地方。

当时可能宣讲会上并没有一个主管能够去描绘清楚这条道路,铁相对这方面人才的要求、未来的发展等等都说得很清楚,就是这个契机吧。


博士的挑战与优势

提问:加入到阿里之后,从学生到正式的员工,从纯研究到研究和应用相结合,这个过程有没有遇到什么问题,不适应的地方,怎么解决的?

靖世:会有一些。其实我加入阿里的时候,除了带着知识,其它什么也没有,更不用谈一些现成的解决方案。所以第一段时间,应该说小半年吧,主要就是熟悉环境、业务特性、数据特性,以及从技术到应用的流程。

这期间有点不知道自己的价值在哪,对应用没那么熟,自己的知识储备跟这边的业务、数据也还找不到到结合点。但是这小半年其实一直在思考技术方面的解决方案,对一些重点的项目,研究这里面到底有什么问题困住了应用的效果。这段时间可能需要沉住气,而且需要持续的思考,把这个阶段渡过去。

提问:在这个过程当中有没有你的主管或者同事给到你一些帮助,让你能够缩短这个过程?

靖世:我当时的几任主管以及业务合作方的leader,对我的帮助和影响蛮大的。他们比我更了解真正在Work的业务背后的技术是怎么运转的,什么东西比较关键,什么东西会有比较大的影响,我们会经常一起讨论;

我经常会提出一些想法,有些不靠谱,有些靠谱,他们往往持一个非常鼓励的态度,对一些跟传统方法不一样的点,会跟我讨论,这个我觉得其实对一个新人非常受用。

我记得当时提了一个新的机器学习算法,提出来之后,大家讨论的时候有一大堆质疑,它Work不Work,能不能够收敛等等。然后我的主管觉得,那些问题在做出来之前不能完全讨论清楚。但是他看到了这个新算法的潜力,他觉得我可以去试一试,后来整个大家的疑问也是在一次次迭代的尝试中慢慢打消的。刚开始其实问题比潜力更多,如果不看潜力只说问题的话,可能这个事情就结束了。

提问:你在阿里其实也做了很多事情,能不能讲讲你觉得成就感比较高的事情?

靖世:到阿里之后,前期其实是在做一些新的机器学习算法跟模型的开发,然后也是希望这些算法跟模型能够赋能业务,在业务里面取得更好的效果。我在前期开发了一个叫分辨线性模型MR的算法,这个算法在多条业务线都变成了主力模型,为其中的机器学习应用和业务效果的持续增长做了很大的贡献,这个是前几年持续在做,持续在优化并且细化,做完整的一个事情。

这两年做的是深度学习平台跟深度学习算法的一些开发。深度学习上面如何跟互联网数据进行结合还是有很多挑战性课题的,我们也是做了一些工作有了一些成果,也对外公开了。团队其实在这方面还有非常多的积累,下一步也是希望这些东西能够跟业界进行更多交流。

提问:从一名校招生成长为资深专家,你觉得博士的经历对你的工作有什么影响?

靖世:我感受到最大的帮助是两个:第一是对韧性的锤炼。读博的时间一般是比较长的,通往毕业的道路大多数都不是一帆风顺的,不管你发论文顺不顺利,毕业这件事总是会面临某些坎坷。博士对我的影响除了知识,最大的大概就是培养了韧性和沉得住气的精神。很多时候一件事不能马上够到结果的时候,或者做到比一般人更大一点的时候,都需要非常强的坚持跟韧性在里面。

第二是科学素养方面。机器学习相关的理论跟一些算法的研究方法,用严谨的科学去看待问题的态度,这些对工作会有直接的帮助。我觉得偏理论方面的底子,在工作期间其实是挺难补的,反到是偏方法层面的东西在工作期间还可以快速地学习到。

提问:你当初的博士同学们现在都在做什么?和他们相比,你觉得现在的你有什么不同?

靖世:实验室因为是机器学习方向,所以他们大部分都是在机器学习相关的工作上,基本上以我这届为分界点,之前的可能更多的在研究机构,之后的更多的在工业界。跟在研究院的同学相比,可能我在真正解决实际问题、在应用场景中实现结果的能力上会突出一些。


工业界或许有更广阔的天地

提问:怎么看待现在很多学术界的人才加入工业界?

靖世:我觉得这是一个趋势吧,是一个很好的时机,工业界的应用跟学术界的最新进展其实是结合的,尤其在机器学习方向的结合前所未有的紧密。也说明目前的研究已经到了一个能应用或者潜在能应用的临界点,所以工业界特别关注,学术界的资源也在加快跟工业界结合。

而且两者之间的界限会越来越窄,这种研究跟创新性的工作并不局限于在学术界做,甚至更多的已经转到工业界了,因为工业界需求很强,舞台也比较大。工业界能提供的研究资源,比如数据、计算能力也会更强。

对于学术界转移到工业界的同学,可能有个挑战是要先摸清楚业务跟应用,摸清楚之后才能很顺畅的把这种研究结果和研究能力注入到实际的业务里。

提问:你觉得从你团队,或者说整个阿里,具备什么样素质的博士生才能够更好地加入阿里,去做一些事情?

靖世:我是觉得可能是需要有一个比较好的一个专业底子,然后在方法上有创新的精神,创新跟钻研的精神,对业务跟应用要有比较强的兴趣。这三点都具备的话,我认为是一个比较好的一个博士生。这样的同学会更快适应工业界,也更容易出类拔萃!

提问:哪些岗位或领域里面,阿里急需博士的加入?

靖世:我看到的主要是机器学习、NLP、图形图像、语音交互、运筹优化等人工智能方向,阿里这方面的投入、业务场景会越来越大,然后对结果的期待也会很大,我们在这块急需的人才,包括资深的研究人员跟刚毕业的博士生。当然我们我们在研发类岗位上,也需要博士的加入。

提问:对于即将面临毕业的博士生,你有什么建议?

靖世:建议就是如果找工作的话,可以尝试一下研究跟应用结合得比较好的地方,或许未来的发展空间会更广泛。在未来的工作上,希望他们一样要有坚韧跟坚持的精神,要能够去渡过一些临时的挫折,长期保持钻研跟创新的精神。要能脚踏实地,能沉得住气,能够坚持跟坚韧,但是内心又要保持追求卓越的精神。

提问:如果让你给阿里的博士生招聘打个广告,你会怎么说?

靖世:阿里巴巴其实可以说是一个数据公司,我们在数据搜集、数据应用方面持续投入了非常大的资源。因为我们的业务涉及了人们工作和生活的方方面面,这些业务每天都在产生大量数据。

我们其实拥有着世界上最大的数据场景,我们还有世界最大的market place。了解机器学习和人工智能的人都知道,一个是数据,数据决定了特征或者你怎么玩;一个是market place,里面很多点其实是Label。所以在数据跟目标两方面,都比较全的是阿里巴巴。

而这些数据的价值发挥,需要仰仗背后的算法跟人工智能,而每个方面的数据的价值,如果发挥出来,可以推动社会方方面面的进步,这里面的舞台和空间是巨大的。

image
image

来源:阿里巴巴招聘
原文链接

相关文章
|
2月前
|
机器学习/深度学习 人工智能
打开AI黑匣子,三段式AI用于化学研究,优化分子同时产生新化学知识,登Nature
【10月更文挑战第11天】《自然》杂志发表了一项突破性的化学研究,介绍了一种名为“Closed-loop transfer”的AI技术。该技术通过数据生成、模型训练和实验验证三个阶段,不仅优化了分子结构,提高了光稳定性等性质,还发现了新的化学现象,为化学研究提供了新思路。此技术的应用加速了新材料的开发,展示了AI在解决复杂科学问题上的巨大潜力。
38 1
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
39 25
|
21天前
|
人工智能 开发者
人类自身都对不齐,怎么对齐AI?新研究全面审视偏好在AI对齐中的作用
论文《AI对齐中的超越偏好》挑战了偏好主义AI对齐方法,指出偏好无法全面代表人类价值观,存在冲突和变化,并受社会影响。文章提出基于角色的对齐方案,强调AI应与其社会角色相关的规范标准一致,而非仅关注个人偏好,旨在实现更稳定、适用性更广且更符合社会利益的AI对齐。论文链接:https://arxiv.org/pdf/2408.16984
30 2
|
22天前
|
人工智能 自然语言处理 Swift
探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!
阿里国际AI团队发布的新模型Marco-o1,不仅擅长解决具有标准答案的学科问题(如代码、数学等),更强调开放式问题的解决方案。该模型采用超长CoT数据微调、MCTS扩展解空间等技术,提升了模型在翻译任务及复杂问题解决上的表现。研究团队还开源了部分数据和模型,供社区使用和进一步研究。
|
1月前
|
人工智能 知识图谱
成熟的AI要学会自己搞研究!MIT推出科研特工
MIT推出科研特工SciAgents,结合生成式AI、本体表示和多代理建模,实现科学发现的自动化。通过大规模知识图谱和多代理系统,SciAgents能探索新领域、识别复杂模式,加速新材料发现,展现跨学科创新潜力。
42 12
|
1月前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
2月前
|
人工智能 自然语言处理
召唤100多位学者打分,斯坦福新研究:AI科学家创新确实强
【10月更文挑战第6天】斯坦福大学最新研究评估了大型语言模型(LLMs)在生成新颖研究想法方面的能力,通过100多位NLP专家盲评LLMs与人类研究人员提出的想法。结果显示,LLMs在新颖性方面超越人类(p < 0.05),但在可行性上略逊一筹。研究揭示了LLMs作为科研工具的潜力与挑战,并提出了进一步验证其实际效果的设计。论文详见:https://arxiv.org/abs/2409.04109。
46 6
|
2月前
|
消息中间件 人工智能 Cloud Native
|
2月前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
|
2月前
|
人工智能 Ubuntu Linux
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)