徐葳:做“跨学科”的点点星火 | 访交叉信息研究院助理教授徐葳

简介:

好雨知时节,当春乃发生。随风潜入夜,润物细无声。

在北京2018年的第一场春雨后,我们见到了徐葳。伴随着空气中还有些泥土与水汽的味道,脑海里倏地就想到了上面这首有关“育人”的诗。恰巧,他与我们聊起的第一个话题就是“教学”。教学这个词很大,如果认真说起来恐怕几天几夜都聊不完,但如果只讲数据科学这一个领域,徐葳用了简短的一句话概括:“在学习的过程中,不断解决问题,发现价值。”

缘何而来:新故相推,日生不滞

严谨、有条理,无论要阐述多少观点,理性的逻辑链条都时刻在线。和徐葳有过交流的人,大抵都会给出这样的评价。说起为何参与到数据院的建设,徐葳采用了一种倒推的方式开始讲述。“最初我参与了数据院的筹建会,是研究生的老师叫我一起的。而接触到研究生院,则是因为跟他们一起做在线教育。”理性的表述方式特别符合大家对他的评价。然而他的下一句话就变得感性起来:“但之所以参与得这么深度,是因为这件事儿有意思!”

2014年9月,在研究生院的牵头下,大数据能力提升项目正式招生,开设了《大数据系统基础》、《数据分析》等课程。徐葳作为以上课程的授课教师,开始了一种新的尝试。“2014年的时候,数据科学这个概念在业界刚兴起不久,大家都在探索,数据科学的教学到底该如何开展?应该面向什么样的学生?基于这些问题,我们就做了一些相关的调研。”

徐葳在当时调研了很多国外的院校,其中部分院校开设了“大数据专业”,也有部分院校把“大数据”作为人才培养项目来发展。而其中比较成熟的,则是在美国颇受关注的伯克利MOT(Management of Technology,即“技术管理”证书项目)。而这种模式也恰好与学校一直支持的学科融合、学科交叉有很强的相关性。清华大学大数据能力提升项目的雏形也就此开始显现。

bd78aea77700eff0d87830eacbd1783855cae935

“我觉得所谓跨学科的教学,其实就是一种语言课。” 提及跨学科学习,徐葳颇有一些“执念”。这个执念,来自于对大数据真正作用的探寻:“这主要分为两方面。一是教大家说这个学科的语言。比如我太太是学MBA做金融的,她做的金融模型我做不出来,但是她的思维方法和她用的描述语言我能看懂,知道它要干什么,这就是理解这门学科的语言;二是你能理解别人的需求,尤其是对于比你更不懂的这个领域的人。我觉得这才是重要之处。”而也恰恰因为这股执念,徐葳开始琢磨如何让这门“语言课”充分发挥价值。于是我们又聊回了开篇的那个话题:为什么数据院正在做的事儿有意思。让学校里不同专业的学生一同上课,促进交流,相互学习。这种新型的教学方式徐葳觉得:“是个新鲜事儿!”

然而,由于不同背景的学生对于数据科学的理解程度也参差不齐,对于基础薄弱的同学来说,有些内容十分吃力。“同学们叫苦连天。”所以,课程最后还是分A/B班上了,A班为非信息类的学生,相对基础;B班是信息类的学生,比较深度。而徐葳觉得这离“跨学科”的初衷有些距离,因为这失去了把不同专业的学生融合在一起的机会。

后来他设计出了一个新的方法:上课分开上,但是课程项目A/B班一起做!这就使得不同学科背景的学生有机会进行深度的思想交汇,非信息类的同学可以组织信息类同学做数据抓取、建模、做前端界面等工作。而数据抓取后的分析、发现及解决问题,则是非信息类的学生所擅长的。

“为了好的结果,不仅要有取有舍,还要适时变化,方能长久。”徐葳说道。然而,大数据作为一门新兴学科,其人才培养的之路却道阻且长。

知难而起:解决问题、发现价值

2017年7月,徐葳所辅导的第一位博士生毕业了,这件事让他感慨很深。为此,他还专门写了一篇题为《建立与学生的信任——写在第一个博士生毕业之际》的文章。文中提到:我从来不是天才儿童型的学生,幸运的是,我一路碰到了很多好老师,教育不仅教给了我计算机科学知识,更是改变了我整个人。我自己的经历让我相信,教育是可以(正面地)影响一个人的整个人生

1999年初入清华之时,徐葳还是懵懵懂懂的本科生。曾在教室听课记笔记,也曾在西操放飞奔跑。可能当时的他并没有想过,会在十几年后,以另一种身份回到这里。在回到清华之前,徐葳曾在Google总部工作,负责基础架构的研发。以往的工作经验让他更加明白“实践”的重要性。因此当他来到讲台时,不仅成为了知识的传授者,也带着学生真刀真枪搞实践,变成了学生与企业之间的沟通者。

“我觉得大数据最重要的是应用。你要是说单纯是技术方面,那你为什么不去学计算机?为什么不去学统计?相信无论上面哪个专业在技术方面都比大数据要研究得深入。”徐葳缓缓道来,“大数据的学习绝不是躲进小楼自成一统,在实践的过程中才能碰撞出灵感。”大数据能力提升项目中的《大数据实践课》由此进一步发展。

然而实践说起来容易,做起来难。每个企业所处的行业、细分领域都不一样,这就导致了有些企业能够理解“什么是大数据”,而有些企业对数据几乎没有概念。“这些企业确实拥有很多数据,但是说不清自己的需求到底是什么,或者提出的需求没有价值。”徐葳说道。

而另一方面,学生们也经常会出“小状况”。为了让学生们进一步深度到企业,了解企业的真是需求,徐葳要求学生们尽量跟不同类型的人去沟通,建立开放的思维。然而有些学生面对企业“没有价值”的需求,则会产生一些抵触心理。“有的学生跟我说,‘这个企业的人不懂大数据,不懂就没办法指导我’,或者‘企业没给我合适的数据,没数据我就绝对做不出来。’我经常会收到类似于这样的反馈。”说到这个,徐葳有些无奈。

1e4d9f33330c26dc0fc7f4814c16ee04c3ab403b

但是他随即给我们讲起了另一个故事:“我在上学的时候,是很畏惧跟人交流的。那时候我成绩不错,但是由于很少说话也很少参与集体活动,很多老师和同学都不认识我。当时我的导师给了我很多的机会去锻炼,每年两次给业界人士演讲,我去参会之前他一遍一遍帮我修改讲稿,帮我排练。我当时还挺烦他的,觉得他逼我,然而,在我做了几次成功的演讲之后,我感觉我走出了这个怪圈,之后我再演讲慢慢没有那么紧张了。”

回想起自己导师当时的做法,徐葳向学生们表述了两个理念:一是相信自己能做到;二是适时改变、因地制宜。“为了解决这个问题,我就跟学生说,给企业提出你能做出来的需求,并向他们解释清楚什么他们提的需求没有意义或者为什么你做不出来。对于我来说,我要求学生们阐述,通过有限的数据分析,你们能得出什么样的结论,能挖掘出什么样的价值。有时候不需要做到100%,70%甚至20-30%就足够产生价值了。”

数据院教学部主管罗国荣,在大数据能力提升项目中,与徐葳合作紧密。据她回忆道:“碰到问题了,有时候徐葳老师会带着学生们亲自跟企业谈判。他有项目管理的经验背景,学术积累又很丰富,所以跟企业对接起来也更高效。探索的过程中,困难一定会有,但关键看如何解决它。”

从最初的10个小组,到如今的30多个小组,越来越多地学生参与到实践的环节中。回首这两年走过的足迹,徐葳说道:“不仅学生们通过实践收获了很多,我也学到了很多。”

路在前方:星星之火,可以燎原

2016年9月9日,徐葳获得了清华大学第15届“良师益友”特别奖。在颁奖典礼上,他说了这样一句话:“我要对我的学生负责任,和他们一同进步成长。”作为2017年度图灵奖得主David A. Patterson教授的高足,交叉信息研究院助理院长,徐葳的学术能力自不待言。此外,他为人风趣幽默,一直备受学生们的敬重和爱戴。然而,与这些相比,更重要的是一种“情怀”。

“教学生们有用的东西,让他们做有价值的事情。”徐葳将教学过程中的价值分为其二,一方面是对于学生们的价值:“学生们不断去适应新的教学方式,然后慢慢去消化,能够真正学到东西。”

另一方面价值,则更偏向于结果。“如果生物材料专业的学生学了我们的项目,最后去BAT了,对于他个人来说可能是成功的,但那是我们的失败,因为那并不是我们的初衷。我们不是让大家都改行去学计算机,我们希望看到的是,他去了他所在领域的企业从事数据相关的工作。如果回到原点,我们来探讨清华能培养多少人?其实没有办法看绝对数量,那么我们对国家的贡献在哪?那就是把这些具有跨学科学习及应用能力的人撒道各个领域,他既有数据思维,又有行业背景,又是清华毕业的,他能够潜移默化地去影响周围的人有数据思维。尤其是传统行业,逐步地给这个行业带来一些小变化,就是我们的成功。”

“星星之火,可以燎原。”


原文发布时间为:2018-06-8

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
算法
孜孜不倦,上下求索——悼念原复旦大学计算机学院朱洪教授
上海交通大学软件学院副教授李停舟发微博称,原复旦大学计算机系教授朱洪1月27日逝世。朱洪教授是我国知名算法理论专家,也是复旦大学计算机科学技术学院40多年发展的亲历者和建设者。本文将朱洪教授在复旦工作的经历进行编辑,以念逝者。
3492 0
|
19天前
|
Go 数据库 知识图谱
中科院一区7.9分top刊|好久不见,网络药理学(实验为主生信为辅)
`Phytomedicine` 杂志2023年6月发表了一篇关于网络药理学的文章,研究了肾康注射液(SKI)治疗糖尿病肾病(DKD)的机制,重点关注其通过Keap1/Nrf2/Ho-1信号通路对抗氧化应激的影响。研究表明,SKI可能通过调节氧化还原相关信号,减轻AGEs诱导的氧化应激,从而改善DKD。在动物实验中,SKI降低了DKD大鼠的尿蛋白、Scr水平,改善了肾功能和血脂,减少了氧化应激指标,并在细胞实验中显示了类似的效果,激活了Keap1/Nrf2/Ho-1通路。
48 1
|
机器学习/深度学习 人工智能 自然语言处理
北大、阿里妈妈成立联合实验室,产学大牛合体,图模型、博弈论都安排上了!
北大、阿里妈妈成立联合实验室,产学大牛合体,图模型、博弈论都安排上了!
|
数据采集 机器学习/深度学习 人工智能
国产框架MindSpore联合山水自然保护中心,寻找、保护「中华水塔」中的宝藏生命
国产框架MindSpore联合山水自然保护中心,寻找、保护「中华水塔」中的宝藏生命
|
机器学习/深度学习 人工智能 自动驾驶
IJCV 亚洲之夜,机器之心与CV领域顶级期刊首位华人主编汤晓鸥聊了聊
CVPR(计算机视觉与模式识别会议)是计算机视觉领域的三大顶级会议之一,它的举办让七月的火奴鲁鲁更加热情似火。
953 0
IJCV 亚洲之夜,机器之心与CV领域顶级期刊首位华人主编汤晓鸥聊了聊
《Science》刊登中科院最新突破,用二氧化碳合成淀粉,网友已开始安排诺贝尔奖
《Science》刊登中科院最新突破,用二氧化碳合成淀粉,网友已开始安排诺贝尔奖
157 0
《Science》刊登中科院最新突破,用二氧化碳合成淀粉,网友已开始安排诺贝尔奖
DayDayUp:本博主预计2019下半年将会出两本书(关于人工智能算法及其实战案例应用方向、计算机算法竞赛集锦方向),如有合作意向,请留言告知
DayDayUp:本博主预计2019下半年将会出两本书(关于人工智能算法及其实战案例应用方向、计算机算法竞赛集锦方向),如有合作意向,请留言告知
DayDayUp:本博主预计2019下半年将会出两本书(关于人工智能算法及其实战案例应用方向、计算机算法竞赛集锦方向),如有合作意向,请留言告知
|
机器学习/深度学习 人工智能 自然语言处理
中戏开设“戏剧人工智能”专业,首招2名博士生!优先考虑对戏剧感兴趣的理工考生
中戏开设“戏剧人工智能”专业,首招2名博士生!优先考虑对戏剧感兴趣的理工考生
322 0
专为研究学者及医学单位提供投稿指南
医学期刊导航网隶属于郑州承泰电子信息有限公司,为研究学者及各类医学单位集成整合知识信息资源,整体提高资源的综合利用价值!选择了金盾服务商飞色网络的云官网定制服务来建设导航网站,中国医学期刊导航网专为研究学者及各类医学单位提供投稿指南。