AI大咖专访丨阿里靖世:博士的研究同样可以在工业界做,更可以影响亿万人的生活!

简介:

盖坤,花名靖世,阿里巴巴资深算法专家。

如果他从办公室的过道中走过,常常会引起周围女生的侧目。

他可是某年阿里妈妈团队女神公选的四大男神之一,在他的粉丝后援会里,横跨20岁出头刚毕业的少女粉和40多岁的风韵犹存的亲妈粉!

加入阿里之前,他是一位清华大学的博士生,期间主攻机器学习和计算机视觉的研究。

他的专研精神从那时开始一直弥漫。

博士期间,他在国际顶尖期刊和会议(包括TPAMI,NIPS,CVPR,AAAI等)上发表多篇学术论文,还获得了中国人工智能协会优秀博士论文奖。

2011年毕业后加入阿里巴巴,从事广告和推荐系统中的算法研究,带领团队提出了大规模非线性学习算法,在多个广告和推荐场景获得显著效果提升;组建了阿里妈妈图像团队,在Logo检测、OCR等关键任务上获得了效果突破,在商品审核和商品投放中发挥了重要作用。目前负责阿里妈妈精准展示技术部。
如果你有机会和他一起吃饭,他一定会饶有兴致地把餐桌上的蔬菜都为你讲解一遍。

“你知道吗,油麦菜和莴笋其实来自于同一种植物,只不过前者是叶用,后者是茎用。”

image

在同学们面临毕业抉择的当下,我们为大家采访了这位可爱的博士,他分享了作为一名博士生,从毕业择业到进入工业界的经历,相信对大家会有很多借鉴意义。


从学术界到工业界的选择

提问:当时在毕业的时候,在选择择业机会的时候,有哪些考虑?

靖世:当时其实主要考虑的有两点吧:一是希望做一些研究跟应用结合的东西。我在学校的时候,主要是做研究工作,会觉得这个对世界的影响有点不是那么直接。然后就想做一些应用工作,但也不想做那种纯应用,一点研究性质都没有,不想把自己的积累和兴趣断掉。
第二是想看看这里面的平台跟空间有多大。当时正好阿里巴巴在开始组建机器学习系统跟平台,而且阿里本身的平台跟业务空间特别广,会觉得在这里面研究跟应用能够达到一个平衡跟结合,所以这是当时的考虑。

提问:什么时候开始接触阿里,为什么加入阿里?

靖世:当时阿里在清华做宣讲的时候,我当时没去,我同学去了,说问了之后说没有这方面(AI方面)的需求,所以后面就没考虑了。偶然有一次,当时铁相(后来成了我的主管)在学校的论坛,当时叫水木清华,发了一个招聘帖子。帖子说阿里在做的一个大规模的机器学习的东西,然后就去聊了一下。
当时其实已经聊过MSRA跟IBM CRL了,原本主要看的是这类研究院,觉得从学术界到研究院可能会稍微平滑一点。但是我也了解到他们在应用方面并不是很顺畅,也会担心研究院跟学校区别不大,反而不一定有学校纯粹。

跟铁相聊完后,发现阿里在机器学习上有很强的决心,业务对这块的需求也特别强烈,这会驱使公司持续投入。而且整个业务体量特别大,可以支撑很多技术研究和应用,一个研究跟应用能够平衡结合得比较好的地方。

当时可能宣讲会上并没有一个主管能够去描绘清楚这条道路,铁相对这方面人才的要求、未来的发展等等都说得很清楚,就是这个契机吧。


博士的挑战与优势

提问:加入到阿里之后,从学生到正式的员工,从纯研究到研究和应用相结合,这个过程有没有遇到什么问题,不适应的地方,怎么解决的?

靖世:会有一些。其实我加入阿里的时候,除了带着知识,其它什么也没有,更不用谈一些现成的解决方案。所以第一段时间,应该说小半年吧,主要就是熟悉环境、业务特性、数据特性,以及从技术到应用的流程。

这期间有点不知道自己的价值在哪,对应用没那么熟,自己的知识储备跟这边的业务、数据也还找不到到结合点。但是这小半年其实一直在思考技术方面的解决方案,对一些重点的项目,研究这里面到底有什么问题困住了应用的效果。这段时间可能需要沉住气,而且需要持续的思考,把这个阶段渡过去。

提问:在这个过程当中有没有你的主管或者同事给到你一些帮助,让你能够缩短这个过程?

靖世:我当时的几任主管以及业务合作方的leader,对我的帮助和影响蛮大的。他们比我更了解真正在Work的业务背后的技术是怎么运转的,什么东西比较关键,什么东西会有比较大的影响,我们会经常一起讨论;

我经常会提出一些想法,有些不靠谱,有些靠谱,他们往往持一个非常鼓励的态度,对一些跟传统方法不一样的点,会跟我讨论,这个我觉得其实对一个新人非常受用。

我记得当时提了一个新的机器学习算法,提出来之后,大家讨论的时候有一大堆质疑,它Work不Work,能不能够收敛等等。然后我的主管觉得,那些问题在做出来之前不能完全讨论清楚。但是他看到了这个新算法的潜力,他觉得我可以去试一试,后来整个大家的疑问也是在一次次迭代的尝试中慢慢打消的。刚开始其实问题比潜力更多,如果不看潜力只说问题的话,可能这个事情就结束了。

提问:你在阿里其实也做了很多事情,能不能讲讲你觉得成就感比较高的事情?

靖世:到阿里之后,前期其实是在做一些新的机器学习算法跟模型的开发,然后也是希望这些算法跟模型能够赋能业务,在业务里面取得更好的效果。我在前期开发了一个叫分辨线性模型MR的算法,这个算法在多条业务线都变成了主力模型,为其中的机器学习应用和业务效果的持续增长做了很大的贡献,这个是前几年持续在做,持续在优化并且细化,做完整的一个事情。

这两年做的是深度学习平台跟深度学习算法的一些开发。深度学习上面如何跟互联网数据进行结合还是有很多挑战性课题的,我们也是做了一些工作有了一些成果,也对外公开了。团队其实在这方面还有非常多的积累,下一步也是希望这些东西能够跟业界进行更多交流。

提问:从一名校招生成长为资深专家,你觉得博士的经历对你的工作有什么影响?

靖世:我感受到最大的帮助是两个:第一是对韧性的锤炼。读博的时间一般是比较长的,通往毕业的道路大多数都不是一帆风顺的,不管你发论文顺不顺利,毕业这件事总是会面临某些坎坷。博士对我的影响除了知识,最大的大概就是培养了韧性和沉得住气的精神。很多时候一件事不能马上够到结果的时候,或者做到比一般人更大一点的时候,都需要非常强的坚持跟韧性在里面。

第二是科学素养方面。机器学习相关的理论跟一些算法的研究方法,用严谨的科学去看待问题的态度,这些对工作会有直接的帮助。我觉得偏理论方面的底子,在工作期间其实是挺难补的,反到是偏方法层面的东西在工作期间还可以快速地学习到。

提问:你当初的博士同学们现在都在做什么?和他们相比,你觉得现在的你有什么不同?

靖世:实验室因为是机器学习方向,所以他们大部分都是在机器学习相关的工作上,基本上以我这届为分界点,之前的可能更多的在研究机构,之后的更多的在工业界。跟在研究院的同学相比,可能我在真正解决实际问题、在应用场景中实现结果的能力上会突出一些。


工业界或许有更广阔的天地

提问:怎么看待现在很多学术界的人才加入工业界?

靖世:我觉得这是一个趋势吧,是一个很好的时机,工业界的应用跟学术界的最新进展其实是结合的,尤其在机器学习方向的结合前所未有的紧密。也说明目前的研究已经到了一个能应用或者潜在能应用的临界点,所以工业界特别关注,学术界的资源也在加快跟工业界结合。

而且两者之间的界限会越来越窄,这种研究跟创新性的工作并不局限于在学术界做,甚至更多的已经转到工业界了,因为工业界需求很强,舞台也比较大。工业界能提供的研究资源,比如数据、计算能力也会更强。

对于学术界转移到工业界的同学,可能有个挑战是要先摸清楚业务跟应用,摸清楚之后才能很顺畅的把这种研究结果和研究能力注入到实际的业务里。

提问:你觉得从你团队,或者说整个阿里,具备什么样素质的博士生才能够更好地加入阿里,去做一些事情?

靖世:我是觉得可能是需要有一个比较好的一个专业底子,然后在方法上有创新的精神,创新跟钻研的精神,对业务跟应用要有比较强的兴趣。这三点都具备的话,我认为是一个比较好的一个博士生。这样的同学会更快适应工业界,也更容易出类拔萃!

提问:哪些岗位或领域里面,阿里急需博士的加入?

靖世:我看到的主要是机器学习、NLP、图形图像、语音交互、运筹优化等人工智能方向,阿里这方面的投入、业务场景会越来越大,然后对结果的期待也会很大,我们在这块急需的人才,包括资深的研究人员跟刚毕业的博士生。当然我们我们在研发类岗位上,也需要博士的加入。

提问:对于即将面临毕业的博士生,你有什么建议?

靖世:建议就是如果找工作的话,可以尝试一下研究跟应用结合得比较好的地方,或许未来的发展空间会更广泛。在未来的工作上,希望他们一样要有坚韧跟坚持的精神,要能够去渡过一些临时的挫折,长期保持钻研跟创新的精神。要能脚踏实地,能沉得住气,能够坚持跟坚韧,但是内心又要保持追求卓越的精神。

提问:如果让你给阿里的博士生招聘打个广告,你会怎么说?

靖世:阿里巴巴其实可以说是一个数据公司,我们在数据搜集、数据应用方面持续投入了非常大的资源。因为我们的业务涉及了人们工作和生活的方方面面,这些业务每天都在产生大量数据。

我们其实拥有着世界上最大的数据场景,我们还有世界最大的market place。了解机器学习和人工智能的人都知道,一个是数据,数据决定了特征或者你怎么玩;一个是market place,里面很多点其实是Label。所以在数据跟目标两方面,都比较全的是阿里巴巴。

而这些数据的价值发挥,需要仰仗背后的算法跟人工智能,而每个方面的数据的价值,如果发挥出来,可以推动社会方方面面的进步,这里面的舞台和空间是巨大的。

image
image

来源:阿里巴巴招聘
原文链接

相关文章
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
通古大模型:古籍研究者狂喜!华南理工开源文言文GPT:AI自动断句+写诗翻译,24亿语料喂出来的学术神器
通古大模型由华南理工大学开发,专注于古籍文言文处理,具备强大的古文句读、文白翻译和诗词创作功能。
44 11
通古大模型:古籍研究者狂喜!华南理工开源文言文GPT:AI自动断句+写诗翻译,24亿语料喂出来的学术神器
|
11天前
|
人工智能 自然语言处理 API
OpenDeepResearcher:开源 AI 研究工具,自动完成搜索、评估、提取和生成报告
OpenDeepResearcher 是一款开源 AI 研究工具,支持异步处理、去重功能和 LLM 驱动的决策,帮助用户高效完成复杂的信息查询和分析任务。
152 18
OpenDeepResearcher:开源 AI 研究工具,自动完成搜索、评估、提取和生成报告
|
13天前
|
存储 人工智能
Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈
哈佛大学和麻省理工学院的研究人员最近发布了一项重磅研究,对Scaling Law在低精度量化中的应用提出严重质疑。研究表明,随着训练数据增加,低精度量化带来的性能损失也增大,且与模型大小无关。这挑战了通过增加规模提升性能的传统观点,提醒我们在追求效率时不能忽视性能损失。该研究结果在AI圈内引发广泛讨论,提示未来需探索其他方法来提高模型效率,如混合精度训练、模型压缩及新型硬件架构。论文地址:https://arxiv.org/pdf/2411.04330。
39 11
|
27天前
|
机器学习/深度学习 人工智能 算法
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题
《PatternBoost: Constructions in Mathematics with a Little Help from AI》提出了一种结合传统搜索算法和Transformer神经网络的PatternBoost算法,通过局部搜索和全局优化交替进行,成功应用于组合数学问题。该算法在图论中的Ramsey数研究中找到了更小的反例,推翻了一个30年的猜想,展示了AI在数学研究中的巨大潜力,但也面临可解释性和通用性的挑战。论文地址:https://arxiv.org/abs/2411.00566
77 13
|
27天前
|
存储 人工智能 自然语言处理
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
OmniThink 是浙江大学与阿里通义实验室联合开发的机器写作框架,通过模拟人类迭代扩展和反思过程,生成高质量长篇文章,显著提升知识密度和内容深度。
164 12
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
|
1月前
|
人工智能 缓存 Ubuntu
AI+树莓派=阿里P8技术专家。模拟面试、学技术真的太香了 | 手把手教学
本课程由阿里P8技术专家分享,介绍如何使用树莓派和阿里云服务构建AI面试助手。通过模拟面试场景,讲解了Java中`==`与`equals`的区别,并演示了从硬件搭建、语音识别、AI Agent配置到代码实现的完整流程。项目利用树莓派作为核心,结合阿里云的实时语音识别、AI Agent和文字转语音服务,实现了一个能够回答面试问题的智能玩偶。课程展示了AI应用的简易构建过程,适合初学者学习和实践。
100 22
|
1月前
|
人工智能 API 开发者
阿里CEO吴泳铭-2024互联网大会发言:AI的最大价值是推动生产力变革
11月21日,2024年世界互联网大会“互联网企业家论坛”在乌镇召开。阿里巴巴CEO吴泳铭表示,AI的最大价值在于推动各行各业的生产力变革,而非仅限于开发超级APP。他强调,发展AI需建设繁荣的技术、产品和市场生态。目前,30多万家企业已接入阿里“通义”大模型,应用于代码开发、药物研发等场景。阿里巴巴坚持开源路线,全球开发者基于“通义千问”开发的衍生模型已突破7.8万个。吴泳铭认为,AI的发展需要行业共同努力,建设繁荣生态以实现高质量持续发展。
|
1月前
|
人工智能 自然语言处理 算法
谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形
近日,谷歌DeepMind团队在《自然》期刊上发表了一项名为SynthID-Text的研究成果。该方法通过引入隐形水印,为大型语言模型(LLM)生成的文本添加统计签名,从而实现AI生成文本的准确识别和追踪。SynthID-Text采用独特的Tournament采样算法,在保持文本质量的同时嵌入水印,显著提高了水印检测率。实验结果显示,该方法在多个LLM中表现出色,具有广泛的应用潜力。论文地址:https://www.nature.com/articles/s41586-024-08025-4。
79 26
|
1月前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
2月前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
641 10
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力

热门文章

最新文章