姚振宇:在数据科学培养下,我成为了那个不安分的“细菌” | 优秀毕业生专访

简介:

清华-青岛数据科学研究院(以下简称“数据院”)自2014年4月成立以来,秉承“学校统筹,问题引导,社科突破,商科优势,工科整合,业界联盟”24字指导方针,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才。

由清华大学研究生院、数据科学研究院及相关院系共同设计组织实施的“清华大学大数据能力提升项目”,通过整合建设课程模块,形成大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,提升学生大数据分析能力和创新应用能力。

四年来,来自全校31院系的1136名同学参加大数据能力提升项目,至今共有209位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

清华的数据科学人才培养究竟有什么特别之处?让我们通过倾听优秀的大数据人才讲述他们与“大数据”的不解之缘,一起寻求答案吧!

b3343645c90f5abdef241de656ba98afcd473fd2

姚振宇是清华大学生命科学学院生物材料专业的研究生,师从陈国强教授。“辅修清华大学大数据能力提升项目,我有幸成为了生命科学学院第一个吃螃蟹的人,我的导师曾把自己的学生比作细菌,我可能就是被老师悉心培养改造出来的不安分的细菌吧。

某个秋高气爽的晚上,姚振宇脱下白大褂,走出实验室,这次他没有回寝室,而是被学堂路上的一块关于大数据能力提升项目招新宣讲会的展板所吸引,“现场居然来了那么多学生这让我有点意外,我只能和其他同学在第一排桌子前面席地而坐。聊天中发现也有不少像我这样非信息类专业的学生在关注数据科学如何更好地辅助自身专业的研究。”他笑着说道。

项目学习期间,不安分的他又担任了学生大数据协会副会长一职,积极参与组织大数据开放日(Big Data Day)活动,施展文学功底为活动题词“清华园未卜神机融四方数术,学堂路逍遥学子迎天下鸿儒”;担任研究部医疗健康组组长,在一次专访中他还获得了医药公司巨头拜耳集团的实习机会;今年学习成绩优秀、实践经历丰富的他又获得了数据院颁发的RONG奖学金

虽然顶着科研的压力,但他还是会抽时间运动放松身心,现在他已经有了八块腹肌,同时身为燕赵之士,他还时刻怀有一种游侠的气质,临近毕业时他以数据科学知识为剑,在健康医疗行业江湖不停摸索闯荡。姚振宇目前已经在通用电气医疗集团(GE)、拜耳集团处方药事业部、华润医疗等世界知名企业拥有实习经历,“在实习中我充分感受到利用数据思维,可以打破本专业的学科桎梏,多角度全方位分析问题,找到新的解决方法。”

在GE实习期间,他发现销售数据在可视化环节并不规范,数据格式也不清晰,针对此问题结合他在大数据系统基础课程学习到的知识以及公司上传的数据资料,他将数据标签重新统一梳理并制定了一套数据处理的流程图,分析顾客、竞品及产品的市场占有率等数据,显著提升了数据汇总和分析的效率,他敏锐的数据思维和扎实的实操能力得到了部门领导的认可并决定将他留任。

0deb1e6fe83a334c4f96f02be97cf9f0da217b02

数据处理流程图

与姚振宇一起做项目的以太资本顾问申婧曾这样评价他:

在项目落地与实践中,振宇能够将业务本身与大数据思维有机结合,通过标准化路径对工作分类并合理化实现,通过分布式方案模块化汇总问题,并进行有效解决,对结果进行后端可视化呈现,还是实习生的他能有这样的表现让我们很是惊喜。

“面对自己的行业规划,项目的学习对我最大的助益就是拓展了我的思维边界。在一个平台上,做好一件事情需要统筹而又细分的调用资源。平时课堂上,跨学科交叉的A班(非信息类专业)和B班(信息类专业)同学一起学习并完成企业的实践项目,让我更加注重团队的合作和沟通,从而让团队的能力发挥出一加一大于二的效力。未来我想做一名医疗界的产业人,用合作包容的风度和胸怀结合扎实的知识技能以及数据的思维视角在事业上迈向一个新的征程。”向前奔跑吧,姚振宇!


原文发布时间为:2018-06-21

本文作者:数据派

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
10月前
|
JSON 前端开发 数据安全/隐私保护
一文看懂mitmdump加密对抗
一文读懂mitmdump上下游代理实现对抗前端加解密
|
JSON 数据格式 Python
【2023最新】Matlab 保存JSON数据集文件,并用Python读取
本文介绍了如何使用MATLAB生成包含数据和标签的JSON格式数据集文件,并展示了用Python读取该JSON文件作为训练集的方法。
535 1
|
12月前
|
SQL 人工智能 自然语言处理
DataWorks年度发布:智能化湖仓一体数据开发与治理平台的演进
阿里云在过去15年中持续为268集团提供数据服务,积累了丰富的实践经验,并连续三年在IDC中国数据治理市场份额中排名第一。新一代智能数据开发平台DateWorks推出了全新的DateStudio IDE,支持湖仓一体化开发,新增Flink计算引擎和全面适配locs,优化工作流程系统和数据目录管理。同时,阿里云正式推出个人开发环境模式和个人Notebook,提升开发者体验和效率。此外,DateWorks Copilot通过自然语言生成SQL、代码补全等功能,显著提升了数据开发与分析的效率,已累计帮助开发者生成超过3200万行代码。
|
存储 SQL API
探索后端开发:构建高效API与数据库交互
【10月更文挑战第36天】在数字化时代,后端开发是连接用户界面和数据存储的桥梁。本文深入探讨如何设计高效的API以及如何实现API与数据库之间的无缝交互,确保数据的一致性和高性能。我们将从基础概念出发,逐步深入到实战技巧,为读者提供一个清晰的后端开发路线图。
|
机器学习/深度学习 数据采集 算法
Python使用随机森林模型进行电影评分预测
Python使用随机森林模型进行电影评分预测
1911 1
Python使用随机森林模型进行电影评分预测
解决 eslint 双引号报错警告
解决 eslint 双引号报错警告
249 0
|
Oracle 关系型数据库 Linux
服务器Centos7 静默安装Oracle Database 12.2
服务器Centos7 静默安装Oracle Database 12.2
642 0
|
存储 Linux Docker
在Docker中,本地的镜像文件都存放在哪里?
在Docker中,本地的镜像文件都存放在哪里?
|
存储 JSON 安全
深入理解与实践:Token的使用及其在Web应用安全中的重要性
【7月更文挑战第3天】在现代Web应用程序中,Token作为一种关键的安全机制,扮演着维护用户会话安全、验证用户身份的重要角色。本文将深入探讨Token的基本概念、类型、工作原理,并通过实际代码示例展示如何在Web应用中实现Token的生成、验证及应用,以确保数据传输的安全性和用户认证的有效性。
3905 2
|
数据采集 人工智能 Serverless
AI 克隆声音,只需 3 分钟(附最全教程)
文章介绍了GPT-Sovits,一个开源的生成式语音模型,因其在声音克隆上的高质量和简易性而受到关注。阿里云函数计算(Function Compute)提供了一个快速托管GPT-Sovits的方法,让用户无需管理服务器即可体验和部署该模型。通过函数计算,用户可以便捷地搭建基于GPT-Sovits的文本到语音服务,并享受到按需付费和弹性扩展的云服务优势。此外,文章还列举了GPT-Sovits在教育、游戏、新能源等多个领域的应用场景,并提供了详细的步骤指导,帮助用户在阿里云上部署和体验GPT-Sovits模型。
36738 8