金语泽:大数据交叉思维让我更具创新力

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

清华大学首届交叉学科毕业生专访系列

(二)

看大数据课程的交叉理念如何开拓她的思路

并率先拿到微软offer

[导读]清华大学研究生院和清华-青岛数据科学研究院(以下简称“数据院”)经过三年的不断探索,实行价值塑造、能力培养、知识传授“三位一体”的数据院人才培养模式,着力打造具有大数据思维和应用创新能力的π型人才,共输送来自理、工、文、商、医科等背景的大数据学生近千人。这种跨学科交叉培养理念,贯穿于大数据人才培养项目全过程。清华的数据科学人才培养究竟有什么特别之处?让我们通过倾听优秀的大数据人才讲述他们与“大数据”的不解之缘,一起寻求答案吧!



金语泽是清华大学软件学院研三的学生,同时也是大数据能力提升项目的第一批学生。她的本科专业是图形与图像处理,研究生阶段师从刘云浩老师学习大数据科学与技术。“其实我从本科到研究生一直在接触大数据,但是一直不知道该如何分析运用”。无论是图形图像还是数据科学,授课重点都在数据的获取和收集上,而学生在具体数据的分析运用上能力很弱,以致于拿到大量数据后无从下手,而清华大数据课程的学习正好弥补了这块短板。


在导师的推荐下,金语泽选修了数据院的大数据能力提升项目。“我的导师也认为大数据在科研中有很高的应用价值,至少在未来5年内一直都会是一个很火的领域”。选课后她发现这就是自己要找的方向:“就像一扇大门向我打开,开启了一个自己喜欢的领域”。她在百度以及微软的实习都是与此相关。“他们看重的就是我的数据挖掘以及分析应用的能力”。


微软里的大数据研究大多基于英文数据库,很少有工程师会去做中文数据。而金语泽在微软实习期间实现了中文数据项目从零到一的突破。“因为之前没有人做过,所以拿到的数据很杂乱”。首先她需要进行数据清洗,再去思考从什么角度入手分析,最后整理成一份知识图谱。“这些都是我在大数据能力提升项目的课程中学到的”,最后她的成果获得了团队的肯定并被放入了微软的大数据库中。这也让她脱颖而出,成为了同批实习生中第一个拿到微软产品经理offer的同学。


刘云浩,金语泽研究生导师:

在项目中,金语泽能够收集大量项目相关的数据,灵活运用机器学习算法完成数据处理任务,展现了扎实的数据分析能力和良好的数据敏感性。而且她在数据可视化方面有非常好的审美和数据展示能力,给我留下了深刻的印象。


除了学习和工作,金语泽还将数据分析的脑洞开在了班里的党支部建设中。学校官网上每年都会发布各院系的就业情况,但都没有经过分析以及可视化处理。她和班里的同学就利用这些数据,建立模型分析各专业的就业方向、就业水平以及年际波动情况等,最终做成了一份可视化报告。“党建老师觉得这个想法很新颖”。她所在的党支部也因此获得了学校优秀党支部的荣誉。



大数据课程的学习不仅让金语泽发现了自己的兴趣方向,还获得了关于讨论学习的全新体验。“和不同专业的老师同学一起做项目可以发现很多创新点”。金语泽评价道。数据院的课程有一部分是A班和B班一起,让信息类的同学和非信息类的同学一起思维碰撞。“我们有一门课程是经管学院老师教授的,当时就觉得经管老师的思路和我们工科的思路完全不一样。在这门课上我了解到很多新的东西”。

 

今年7月,她就要告别清华园正式走入职场了。有些出乎意料的是,她最终选择就职的不是微软,而是一家亟待在大数据浪潮中转型的传统企业。“可能和我的清华背景有关,我意识到传统企业也在寻求大数据转型,而他们更需要新技术和新想法”。和微软的就业环境相比,这显然是一个挑战与机遇并存的机会,需要勇气更需要睿智,而她也将拥有展示自我的大舞台。



原文发布时间为:2017-05-08 

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
存储 算法 数据可视化
大数据思维|学习笔记
快速学习大数据思维
422 0
大数据思维|学习笔记
|
机器学习/深度学习 存储 人工智能
被神话的大数据——从大数据(big data)到深度数据(deep data)思维转变
自从阿法狗战胜人类顶级棋手之后,深度学习、人工智能变得再一次火热起来,但有一个基本的误解是更大的数据会产生更好的机器学习结果。然而,更大的数据池/仓库并不一定有助于模型学习到更深刻的见解。正确的答案是?
2123 0
|
大数据
常州大学阿里云大数据学院举行“创新思维”课程答辩
创新思维新生研讨课是常州大学校企联合培养学生的第一次课程,课程通过基础概念、实际案例、设计创新等全方位学习方式,夯实学生的理论基础并提高实践能力,扎实推进嵌入式培养成果,更好做好校企联合培养工作,助力大数据产业的持续蓬勃发展。
2044 0
|
机器学习/深度学习 人工智能 大数据
何大安:大数据思维改变人类认知的经济学分析
在人类改造自然和变革制度的历史长河中,认知水平在相当长的时期内是受制于数据积累的。
1624 0