从数据小白到大赛黑马,他们如是说 | 专访2017中国高校SAS数据分析大赛亚军团队-阿里云开发者社区

开发者社区> 技术小能手> 正文

从数据小白到大赛黑马,他们如是说 | 专访2017中国高校SAS数据分析大赛亚军团队

简介:
+关注继续查看

近日,2017年中国高校SAS数据分析大赛北京举办了颁奖仪式,来自清华大学大数据能力提升项目的三位学生(王存光、姚超、李继凡)组队参赛,并一举斩获亚军殊荣。这项以高校数据分析人才为核心的赛事至今已举办至第五届,今年是清华大学第一次派出代表参加比赛。通常的参赛队伍多来自于金融统计专业然而此次获得亚军殊荣的三位学生王存光、姚超、李继凡分别来自于清华大学水利系、精密仪器系和生物医学工程系

968569cb1900db23b6fcd40af1223b627cf0906e

首次参赛“零经验”、交叉学科“罕见背景”、超过1000支的竞争队伍,这对他们来说,无疑是不小的挑战。如何在高手频出的大赛中崭露头角?清华大学大数据能力提升项目又给予了他们怎样的帮助?让我们一起听听,他们怎么讲。

赶Deadline的那些日子

时间比较紧张,从我们决定要参加比赛直到初赛,也就大概10天,所以准备比赛的过程,基本上就是在赶Deadline的过程。备赛时间集中在国庆放假,我们都牺牲了宝贵的假期,疯狂备战。”说到比赛前的准备过程,来自精密仪器系的姚超娓娓而谈,好像一切才过去不久。 

“另一种压力来自于准备过程中的不确定性,就是我们也不知道这样做是对还是错,是否能够继续下去,所以心里有点没谱。不过幸运的是,数据研究院的老师在鼓励和支持我们,还给了我们很多实际的帮助。这次是我们第一次,也是清华第一次参加中国高校SAS数据分析大赛,所以对于比赛信息我们了解得很少,也没有接触过SAS系统进行数据分析,最初不知道该从何下手。后来我们找到了数据研究院的罗老师,她给我们分享了很多《数据分析与优化建模》的往期课件。这些课件系统地介绍了如何使用SAS软件做数据分析,帮助我们在几天之内上了手。”生物医学工程系的李继凡补充说。 

对于姚超、王存光和李继凡三位学生来说,这次比赛所遇到的困难不小——备赛时间短、首次参赛零经验、陌生的数据分析系统。虽初战告捷,他们所遇到的挑战却不止如此。 

“黑马”跨界

在高手如云的中国高校SAS数据分析大赛中,参赛选手们大多来自于金融或统计专业,而王存光、姚超和李继凡三位同学却都是工科背景,甚至来自不同的专业。 

 “我们水利系所用到的数据分析并不复杂,像比赛中这种大型的数据分析在我们专业很少会用到。”清华大学水利系博士二年级在读生王存光说道,“这是我们第一次用SAS这个数据分析工具,所以技术上肯定没有信息学院或者其他相关专业的学生那么熟练,但是因为我们有不同的学科背景,所以每个队员可以根据自己的优势承担相应的工作,充分利用各自学科所带来上‘长板’。 

“初赛题目是与银行信贷相关,因此生物医学工程系的继凡主要负责了变量分类和背景分析的工作,而精密仪器系的姚超主要是将数据中627个特征逐一分析,找出核心变量,而我主要负责了模型搭建的工作。这个过程其实很考验我们的沟通协作能力,每一个环节都很关键。”王存光说。这种跨学科的学习方式,正是清华大学数据科学研究院有别传统的新型教学理念。“和不同专业的人在一起做项目会发现很多创新点,”来自生物医学工程系的李继凡说。在《大数据实践课》上,信息类和非信息类的学生跨学科组队,以团队的形式做项目,使不同背景的学生能够在组内充分交流,相互学习,各自发挥特长。 “平时的这种锻炼对于比赛中所需要的沟通协作能力以及团队凝聚力也有很大的帮助。”李继凡接着说道。 

“未来”已来 

在今天的IT领域,越来越多的问题可以用数据驱动方法来解决。它是大数据的基础,更重要的是,它带来了一种新的思维方式。 

“不能跟信息学院的学生拼技术,还是得拼思维方式和实现能力。冠军队在决赛的时候其实就坐在我们后面,相比之下,他们确实更从容,我们因为对技术不够熟练所以略显匆忙,”姚超说,“技术方面我们工科背景的学生肯定是没有优势的,但是好在我们会及时发现问题并解决问题,动手能力比较强。而且我们可以与专业知识结合在一起做项目,数据只是一种手段,思维方式是关键。 

“就是数据院常说的π型人才嘛。” 李继凡接过了话头。李继凡所说的π型人才正是清华大学数据研究院重点着力的人才培养方向,通过大数据思维与技能、跨界学习能力、实操应用相结合的课程体系,帮助清华学子们将大数据思维与应用创新有机结合,为大家日后的发展提前打好基础。 

“总之,比赛一定程度上还是可以检验并提升自己的,希望在下次的比赛中,我们能够有更好的发挥。” 李继凡继续说道。

创新需要勇气,提升离不开实践。大数据思维、跨界学习、应用实操相结合的培养与锻炼,成为了王存光、姚超、李继凡三位同学在此次比赛中的“力量之源”。清华大学首次派队角逐中国高校SAS数据分析大赛便满载而归,同学们在此次比赛中所展现的能力,是他们自我努力的体现,也是数据科学研究院先进教学理念的展示。希望今后数据院能够帮助更多的清华学子,在数据科学领域绽放异彩,找到属于自己的人生舞台。


原文发布时间为:2017-12-4

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
近10年数据智能团队建设,联想总结了由内而外的发展经验 | 专访联想集团副总裁田日辉
近10年数据智能团队建设,联想总结了由内而外的发展经验 | 专访联想集团副总裁田日辉
29 0
算法博士平均月入4万,数据可视化技能全球吃香 | 2020年《顶级数据团队建设全景报告》重磅发布
算法博士平均月入4万,数据可视化技能全球吃香 | 2020年《顶级数据团队建设全景报告》重磅发布
16 0
SAS进阶《深入分析SAS》之数据汇总和展现
SAS进阶《深入分析SAS》之数据汇总和展现 1. 通过Print过程制作报表 proc print <data=数据集>; run; 选项: obs=修改观测序号列标签 noobs不显示观测序列号 id语句在输出中取代观测序列 var选择输出的变量 where语句选择输出的观测 总结如下: proc print data=数据集<选项&g
1165 0
企业打开云HBase的正确方式,来自阿里云云数据库团队的解读
一、HBase的历史由来 HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
3890 0
+关注
技术小能手
云栖运营小编~
5953
文章
9
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载