清华大学首届交叉学科毕业生专访系列
(二)
看大数据课程的交叉理念如何开拓她的思路
并率先拿到微软offer
[导读]清华大学研究生院和清华-青岛数据科学研究院(以下简称“数据院”)经过三年的不断探索,实行价值塑造、能力培养、知识传授“三位一体”的数据院人才培养模式,着力打造具有大数据思维和应用创新能力的π型人才,共输送来自理、工、文、商、医科等背景的大数据学生近千人。这种跨学科交叉培养理念,贯穿于大数据人才培养项目全过程。清华的数据科学人才培养究竟有什么特别之处?让我们通过倾听优秀的大数据人才讲述他们与“大数据”的不解之缘,一起寻求答案吧!
金语泽是清华大学软件学院研三的学生,同时也是大数据能力提升项目的第一批学生。她的本科专业是图形与图像处理,研究生阶段师从刘云浩老师学习大数据科学与技术。“其实我从本科到研究生一直在接触大数据,但是一直不知道该如何分析运用”。无论是图形图像还是数据科学,授课重点都在数据的获取和收集上,而学生在具体数据的分析运用上能力很弱,以致于拿到大量数据后无从下手,而清华大数据课程的学习正好弥补了这块短板。
在导师的推荐下,金语泽选修了数据院的大数据能力提升项目。“我的导师也认为大数据在科研中有很高的应用价值,至少在未来5年内一直都会是一个很火的领域”。选课后她发现这就是自己要找的方向:“就像一扇大门向我打开,开启了一个自己喜欢的领域”。她在百度以及微软的实习都是与此相关。“他们看重的就是我的数据挖掘以及分析应用的能力”。
微软里的大数据研究大多基于英文数据库,很少有工程师会去做中文数据。而金语泽在微软实习期间实现了中文数据项目从零到一的突破。“因为之前没有人做过,所以拿到的数据很杂乱”。首先她需要进行数据清洗,再去思考从什么角度入手分析,最后整理成一份知识图谱。“这些都是我在大数据能力提升项目的课程中学到的”,最后她的成果获得了团队的肯定并被放入了微软的大数据库中。这也让她脱颖而出,成为了同批实习生中第一个拿到微软产品经理offer的同学。
刘云浩,金语泽研究生导师:
在项目中,金语泽能够收集大量项目相关的数据,灵活运用机器学习算法完成数据处理任务,展现了扎实的数据分析能力和良好的数据敏感性。而且她在数据可视化方面有非常好的审美和数据展示能力,给我留下了深刻的印象。
除了学习和工作,金语泽还将数据分析的脑洞开在了班里的党支部建设中。学校官网上每年都会发布各院系的就业情况,但都没有经过分析以及可视化处理。她和班里的同学就利用这些数据,建立模型分析各专业的就业方向、就业水平以及年际波动情况等,最终做成了一份可视化报告。“党建老师觉得这个想法很新颖”。她所在的党支部也因此获得了学校优秀党支部的荣誉。
大数据课程的学习不仅让金语泽发现了自己的兴趣方向,还获得了关于讨论学习的全新体验。“和不同专业的老师同学一起做项目可以发现很多创新点”。金语泽评价道。数据院的课程有一部分是A班和B班一起,让信息类的同学和非信息类的同学一起思维碰撞。“我们有一门课程是经管学院老师教授的,当时就觉得经管老师的思路和我们工科的思路完全不一样。在这门课上我了解到很多新的东西”。
今年7月,她就要告别清华园正式走入职场了。有些出乎意料的是,她最终选择就职的不是微软,而是一家亟待在大数据浪潮中转型的传统企业。“可能和我的清华背景有关,我意识到传统企业也在寻求大数据转型,而他们更需要新技术和新想法”。和微软的就业环境相比,这显然是一个挑战与机遇并存的机会,需要勇气更需要睿智,而她也将拥有展示自我的大舞台。
原文发布时间为:2017-05-08
本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号