在阿里做博士后是一种怎样的体验?

简介: 上个月,阿里巴巴发布2018年博士后招聘启事,针对机器智能、机器学习、数据挖掘、机器人、高性能计算、通信技术、人机交互、物联网等研究方向,邀请海内外博士加入阿里博士后科研工作站。

上个月,阿里巴巴发布2018年博士后招聘启事,针对机器智能、机器学习、数据挖掘、机器人、高性能计算、通信技术、人机交互、物联网等研究方向,邀请海内外博士加入阿里博士后科研工作站。

阿里博士后工作站的优势在于真实丰富的业务场景和数据,这对技术研究至关重要,却为高校和科研院所欠缺。因此,打通学术界和工业界就很有必要。这正是阿里这些年努力的方向。

image

阿里巴巴博士后“企业导师”名单

早在2008年,阿里就建立了博士后工作站。2017年10月,立足基础科学、颠覆性技术和应用技术研究,“致力于探索科技未知”的阿里巴巴达摩院成立。得益于此,阿里可以为工作站提供顶尖科学家组成的“明星导师团”:世界顶级量子科学家施尧耘、美国密歇根州立大学前终身教授金榕、亚马逊前最高级别华人科学家任小枫、新加坡南洋理工大学终身教授王刚……在阿里,可以担任企业博士后导师的海内外学术带头人、研发管理人才已有百余人。

针对人才,阿里也开出了丰厚的条件。除了提供“具有市场竞争力的薪酬福利”,协助申请国家级、省级和市级多种科研经费之外,阿里还将协助博士后解决北京或杭州户口。

阿里博士后工作站是阿里博士人才引进和培养的重要平台。现有北京站和杭州站,并与中国科学院、清华大学、浙江大学、上海交通大学、新加坡南洋理工大学等顶尖高校达成了联合培养计划。目前阿里技术团队拥有数百名博士。未来3年博士后工作站计划引入200位青年科学家。

那么,在阿里做博士后究竟是一种怎样的体验?两位阿里博士后和我们聊了聊他们的故事。

做真正影响用户的技术和产品
—— 薛少飞
(阿里北京站第一批出站博士后)

我是去年11月份出站的,现在的Title是阿里达摩院机器智能技术实验室算法专家,主要负责语音识别的技术创新和产品落地。我在这个领域已经做了快十年——本科是中国科学技术大学电子信息专业,大三就进了实验室,后来保送硕博连读,在中科大一直读完博士。

image


薛少飞(左一)参加ICASSP2017国际学术会议

我不完全是个技术男。我喜欢文学、历史,会看很多人文的书,我相信技术能够解决很多的问题:比如可以用规则和统计建模方法解决的问题,技术很大程度上都能够解决。但我觉得技术的作用并不是要取代人类,而是将人类从重复性劳动中解放出来。读了研究生之后,我开始想自己到底要做什么样的工作。过程中也经历了很多尝试,最后我给自己的定位是——做能真正影响用户的技术和产品。

到阿里做博士后,我看重的是阿里这个平台。它有很多的应用场景,有很多的数据。我们做语音识别需要大数据以及资源、平台,阿里都具备,而且我在进入之前就对我们团队有所了解,这是一群能够做出事情的人。

我是阿里北京站第一批博士后,2015年9月进站。刚到阿里做的第一个项目就很有成就感。那是一个智能客服的项目,在用户咨询人工客服之前,先去分析用户的行为,猜测他遇到了哪些问题,推荐给用户一些解决方案。这在当年的“双11”就体现了价值。做项目过程中跟支付宝团队有很多协作,会和他们一块儿头脑风暴。这个过程非常有自我价值实现的感觉,一个做技术的人最希望的就是自己做的东西能够体现出它的价值。

2016年阿里云年会上,我们做的语音识别系统和金牌速记员去做了一个PK,在识别准确率上以微弱优势战胜了人类速记员。我们在业界首个采用了LC-BLSTM声学模型。在当时这个语音识别模型很前沿,在学术研究上也是正在进行当中的。我们首先需要从学术的角度去判断这个东西会不会比现有的模型有一个明显的提升,然后你要迅速地去实现和证明,并进行落地。后来这套模型也用到了其他的产品里面。

LC-BLSTM声学模型相关的技术干货:
为提升在线语音识别效率,他创造了两种升级版算法模型

image

薛少飞(左九)与他所在的机器智能技术实验室团队

现在我的工作与博后期间的研究是有延续的。这两年我做了好几个远场语音识别的项目,最近在云栖大会上亮相的“阿里AI收银员”、“上海地铁语音购票机”都是我参与的项目,我负责其中的远场语音识别部分。上海地铁站的环境非常嘈杂,在那种环境下作出一个非常准确的识别,其实非常难。而且真正的用户行为可能和我们想象的很不一样。比如开始我们会设想很多正常交互的场景,但实际上用户可能很随意,比如只说了地铁站名字,或者中间带许多语气词和停顿。这个过程中我们踩了很多坑。

这是一个根据用户反馈不断迭代的过程。在大学里不会有这些机会。在学校里进行研究的时候,通常你是在做某一个点,其他的都是fix(固定)的——在这种情况下进行这个点的创新。在阿里你会跳出来,跳到一个系统的层面去考虑问题。这个可能涉及学术创新、工程创新、方法创新……它会更全面地要求你,思考的方式是完全不一样的。

到工业界做科研是趋势
——裴昶华
(阿里北京站博士后)

我是2017年7月进站的,经历比较简单,清华计算机2008级本科,然后直博,2017年从清华毕业。我导师现在跟阿里、腾讯和其他公司也有一些深度的合作,他喜欢科研跟企业结合的方式。受导师影响,我也觉得科研应该做一些实际的问题,真正能够影响人们现实生活的问题。

image

裴昶华参加阿里年会

博士的时候,我研究怎么将机器智能用到网络领域,提高网络性能和可用性。来阿里之后,在搜索事业部,研究个性化推荐的问题。很多人都问我,你博士毕业了为什么不去学校,他们理解不了博士为什么要去工业界。大家一般认为去工业界就是写代码,科研能力相当于荒废了。其实不是这样的,我们也写论文,前段时间我刚投了一篇论文。以后企业招的博士后会越来越多,到工业界做科研肯定是一种趋势了。

在阿里的好处是,你不用刻意地去找问题,问题就自动地找上你了。

去年“双11”之前,我们做了一个百万级QPS(每秒查询率)的智能调度系统。“双11”有很多的用户会买买买,后台服务器压力就会突增。以前都是人工调度,看某个场景,比如手淘购物车——压力太大了,就多加点机器。有个人拿个本,在那儿记。我们就想,这是可以用算法解决的。当时就联合另一个团队做了一个调度算法。这个智能调度系统,并不是我们想着去做它,是备战“双11”的时候,人力成本太大,自然而然就想起这个问题。

image

2017年“双11”平稳度过后的凌晨,裴昶华(左二)与参与项目的其他同事合影留念

在阿里,现实问题推动创新的例子有很多。就在上个月,我们做了一个手机淘宝的项目,为了让推荐给用户的商品更精准,我们用了一个新模型­——强化学习模型,算法上线之后,商品点击率提升了7%。这个工作现在我在总结,准备投一篇论文。

到阿里做博士后,对我的影响是比在学校时更重视细节了。在公司你做的项目是真实在线的,做产品对细节要求很严。比如这个调度系统,一旦出什么问题的话,那就会给公司带来直接的损失。那段时间,整天脑子里都是这个,睡觉想着这个东西,去食堂、在办公室里都是想着这个事情,想着哪里有遗漏,哪里还没解。后来“双11”平稳度过,凌晨从办公楼出来,当时就觉得很有成就感。自己做的东西被用上了,用到人们的生活里面,是一种不一样的感觉。

原文发布时间为:2018-07-18
本文来自云栖社区合作伙伴“阿里技术”,了解相关信息可以关注“阿里技术”。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
数据挖掘 UED 开发者
内测邀请|宜搭应用搭建体验全新升级,邀您抢先体验!
宜搭应用搭建体验全新升级,现正式开放内测申请,邀请大家来尝鲜哦~
381 0
内测邀请|宜搭应用搭建体验全新升级,邀您抢先体验!
|
弹性计算 物联网 Linux
阿里云体验
阿里云带给我的体验
|
弹性计算 运维 监控
第一次体验阿里云服务
第一次ecs云服务器体验
|
Linux 云计算
阿里飞天计划体验
阿里云飞天计划体验
|
Web App开发 弹性计算 关系型数据库
基于阿里云的第一次体验
基于阿里云体验云上操作的乐趣
245 0
|
云安全 弹性计算 安全
阿里云服务体验有感
本文主要分为三个部分介绍。第一部分,个人情况简介(也希望能和大家做个朋友)。第二部分,使用云ECS小感受。第三部分,未来计划和安排
|
弹性计算 人工智能 运维
阿里云的体验
阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录
|
弹性计算 大数据 Linux
阿里云服务体验
我是一名电子信息专业的学生,目前研一。在假期的时候通过朋友推荐了解到阿里云的飞天加速计划能够领取免费的学生服务器进行学习,初次试用时间为两周。领取前我在阿里云上完成了学生认证和新手预备训练营,并且学习使用了阿里云的镜像快照等功能。
|
编解码 云计算
体验阿里云有感
我是就读于吉首大学软件工程专业2019级的学生,刚接触云服务器所以对云服务器的了解不多,在阿里云的庞大规模以及影响下了解到阿里云的“飞天加速计划·高校学生在家实践”活动,在人性化的新手引导下了解了使用方式,有了这次机会第一次了解并使用云计算的体验。
下一篇
无影云桌面