清华大数据,365天我们持续在发声——数据院四周年系列报道之传播篇

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

2014年,宏大的时代又催生了一个弱小的组织——清华大学数据科学研究院。这个“初来乍到”的非实体机构,在清华大学官网首页院系设置的树状图上我找不到她的“身影”。“平心而论,技术进步这么快,校内类似的机构有很多,如果都放上去,那将是一棵枝叶茂密的参天大树。你呀,也一样找不到数据院。”韩院长不无幽默地对我说。

“那您是不是就想通过传播,刷刷存在感?”我的问题颇为尖锐直率。

“类似的质疑从数据院开始对外传播那天起就一直有,我先不回答你的问题。等你采访完数据院的合作发展部,直接写出你的结论。”

该成稿了,我还是给不出结论。“存在”的定义太复杂,应该让隔壁来给结论。“存在感”也挺复杂,可以是手段,可以是目的。所以我只能效仿韩院长,先给大家讲故事,把下结论的任务,留给关心和关注数据院发展的你们。

数据派——科技自媒体中不一样的烟火

bd2eae6476f687a85cba3ac334229898d1ec397a

数据派LOGO

2014年11月,数据院推出的微信公众号“数据派”(后更名为THU数据派)正式与大家见面。“基于清华,放眼世界,以扎实的理工功底闯荡数据江湖”是数据派的定位。运营这个微信公众号的重任就落在了薛娅菲身上,“这是我出道的第一份工作。出于对女孩子个人生活的保护,韩院长还特意给我起了一个微信昵称:‘小数点’,我就是第一代的‘小数点’。平台坚持每天更新,发布全球大数据资讯,分享前沿产业动态。我那时一个人起步,天天忙得感觉都喘不过来气。”

万事开头难,如何让清华的大数据更好地发声,如何传递有深度、有见地的大数据知识,这是数据派掌门人薛娅菲面临的一个难题。内容传播上,娅菲请教了新闻与传播学院的金兼斌老师,金老师耐心指导并为数据派做了SWOT分析,制定了个性的运营计划。“文章发出去,就惴惴不安盼着阅读量上来,盼着被读者认可。有一次,一位校领导指出了文中的错别字,我丝毫没有挨批评的沮丧,反而激动的眼泪要掉下来了:领导也在看我做的事情。”薛娅菲回忆说。

“当时,数据院的运作体系还没有建立,是借用了一个师兄的个人微信公众号账号,不能加V认证,有人侵犯版权,我们也无法维权。几经周折,2016年,清华大学加V认证的数据院官方微信公众号‘数据派THU’终于诞生了。从此,一早一晚,朝夕呼应,两个号365天不间断轮流为大家推送数据科学业界和技术类的相关文章和优质活动,读者每一次的留言无论是肯定亦或建议,我们都会认真阅读,并在文章的把控上尽量满足更多粉丝群体的需求。在媒体普遍比较认可的新榜榜单上拥有‘清华大学’认证的31个公众号排名中,‘数据派THU’一直保持在前十名之内,要知道我们的‘竞争对手’大多都是‘清华大学’‘清华大学研究生教育’这样校级单位主办的。”数据派的小伙伴们这样介绍。

如何才能为自己的部门建立一个有效且快节奏的system?带着这个问题,薛娅菲又是邀请经管学院的老师辅导,又是自学考取了“职业规划师”。

07b2f7f478e291c2fc5e87ec003f2a32b0cb4db2

部分志愿者合影

在没有数据院大额预算的支持下,从最初的一个人校对、编辑和转载,到后来近200人来自全国各地热爱大数据的有志青年组成的志愿者团队共同协作,数据派在校内外读者的检验和关注下不断成长。很多人不理解,在物欲横流的时代,数据派的运作是以志愿者为主体。“其实,今天我们年轻人体内一样蕴藏着情怀。数据派的组织运行方式,让参与者的价值得到体现,知识颇有斩获,技能经历磨练。大家都干得很开心呢。”志愿者们说。

2017年,数据派累计发布超过600篇文章,全年共覆盖124万+的读者。依托微信公众号平台,数据派又成功入驻了新浪微博、今日头条、一点资讯等自媒体平台,受邀加入知乎机构号以及云栖社区、开源中国、腾讯云等知名社区平台,并与数十家科技自媒体保持长期的合作。

bcce1d6226da0c6a28a1b35f261915818eab7843

2017年数据派数据统计

作为科技自媒体中的一员,国内顶级行业会议如贵阳数博会、世界乌镇互联网大会、阿里云栖大会等总会见到合作媒体数据派的身影;在校内与数据科学相关的重要事件也会有数据派的报道宣传,如大数据系统软件国家工程实验室合作完成实验室揭牌仪式、与清华经管学院合作中日韩三校MBA学生参观中国本土大数据企业、协助科技大数据中心Aminer产品参与高交会等。其中,科技大数据中心的唐杰老师曾经感慨到:“像数据派这样的宣传力度和广度在我看来是清华很多院系都达不到的。”数据院在品牌宣传上的持续发力,也得到了校内其他老师的认可,工业大数据研究中心、软件学院研究员刘英博老师说:“与数据院合作过很多活动了,非常认可数据派在知识传播中起到的作用,让从事教学和科研工作的老师可以拿出更多的精力放在科研上。”

数据院合作发展部(原名:品牌传播部,因为有人质疑“品牌传播”,后更名。)的同事们可不满足于微信公众号的运营。“韩院长要求我们带着服务的意识去想问题。”为了更好地服务我们读者,我们建立了自己的原创团队,翻译实用又前沿的国外文章、及时整理大咖讲座干货,原创的知识梳理文章“一文读懂系列”“手把手教系列”越来越受到读者欢迎。文章下方常常会看见读者的留言:“好文,果断收藏!”“知识梳理的很清晰,感觉自己对机器学习的架构瞬间明朗了!”

随着对行业了解的深入以及资源、素材的不断积累,2017年原创团队首次撰写并发布《顶级数据团队建设全景报告》,内容包括2000+篇线上调研反馈、50000+网络爬虫数据分析、10位大咖专访,报告全文共30000字。该报告在大数据人才圈取得强烈反响,多家媒体自发报道、转载。

数据派的小编团队为什么这么拼?就是为了向读者呈现“不一样的烟火。”

前沿又高端的线下活动,约么?走起!

下午不到六点,位于双清大厦的报告厅就开始热闹起来,拍摄、直播、音响话筒等设备准备就绪,听众陆陆续续入场。晚七点,报告厅里又传来了那句熟悉的开场白“欢迎大家来到由清华大学数据科学研究院主办的‘应用·创新’讲座的现场,今晚我们邀请到的嘉宾是...”。很多大数据行业的从业者和对数据科学感兴趣的校内外学生通过报名参加数据派平台发布的讲座活动,从线上来到线下,从各自工作和学习的岗位来到清华大数据讲座的现场,活动中他们收获了大数据在各行业各领域的前沿知识,拓展了人脉,甚至与嘉宾成为了朋友。

a9406d92fc68b165d557e1d6b8230b75b203dc06

部分演讲嘉宾

台上的嘉宾既有机器学习之父Michael I.Jordan、中国唯一的图灵奖获得者姚期智等国内外大咖,也有参与数据科学知名赛事(如CVPR、NIPS、PHM和Kaggle等)小试牛刀便夺得头筹的清华及友校学生。在一次次的互动交流中,数据院为大家搭建了知识分享和产学研资源整合的平台。微信号“小数点”“大数点”“红数点”作为组织活动和传播知识的媒介,是大家熟悉的群主,也成为了大家信任并喜爱的网红客服。截至2017年底,数据院共举办了32场“应用·创新”系列讲座、36场“技术·前沿”讲座,19场RONG论坛及研讨会,并针对在校生新开设了“赛事经验分享”系列讲座,共计近七千人次听众参加,话题涉及人工智能、工业大数据、金融大数据、媒体大数据等大家关注较为集中的领域。

3bcba1583dc9c77e307ed33c69e31a2103f2f175

RONG系列论坛剪影

其中,RONG论坛是数据院最具特色的活动,从2014年12月第一场“大数据与新闻传播专场”至今,从校内交流扩展到校外积极响应,“我参与了数百场会议,在这里我真正感受到数据院是没有围墙的学校”——这是来自业界代表的真实心声。每次RONG论坛都会吸引来自上海、广东、河南等地来自企业、高校的听众,其中教育大数据专场还有高校的老师特意带着自己的学生从内蒙古前来参会,“来自清华、北大、人大等教育专家齐聚分享,学生们这次过来都觉得收获不少,希望内蒙古的教育也能赶上大数据的浪潮”带队老师如是说。

8e3e6e59dd493174f340811013187e125b3b369c

大数据日活动(Big Data Day)

c8ca7c520f82a027b733a100c0122c48ce41c75a

数据院大数据能力提升项目宣讲会

除上述专业的学术活动之外,数据院还通过其他各种形式的活动搭建沟通交流的平台:如每年年初举行的新春交流会可谓是大数据相关的政产学研各界人士及校内外学生的大联欢;每年校庆期间于C楼前广场举行的大数据日(Big Data Day),拉近了学生和用人单位的距离,使双方能以更轻松的形式近距离了解彼此的需求;每年9月初的大数据能力提升项目宣讲会,参与的学生几乎涵盖了清华所有院系,也成为了校内众多能力提升项目中最受学生欢迎和喜爱的一个。

在校外,数据院与国内知名机构也进行了深入的合作,如与O’Reilly出版集团合作开展国际大数据行业峰会Strata、与中国电子技术标准化研究院等单位合办的数据标准化治理大会、与微软亚洲研究院合作的三场精彩的学术交流论坛等。“从我和其他高校合作的经验来看,从线下活动举办的质量和数量上,从知识传播的影响力上,好像很少能达到数据院这样的水平。因为很多学校其实都有类似的想法,但却没有付诸行动。”中关村大数据产业联盟副秘书长陈新河说道。

无论你的专业和工作是否和大数据相关,只要你心存一颗热爱大数据的心,数据院的活动总有一款适合你。

业界联盟,激活清华大数据的活力

为了应对大数据时代的机遇和挑战,在数据院的发起指导下于2014年成立了清华大数据产业联合会(筹)。后因形势需要,更名为清数大数据产业联盟(以下简称:联盟),加入中国科技产业化促进会。联盟依托清华大学独特的师资和生源优势、清华大学多个院系和学科在大数据相关领域多年的积累与探索,以及大数据产业链中的优秀龙头企业与创新企业,聚拢的大数据相关资源。现联盟拥有近20个微信群友常规群(应用群、技术群、金融群、营销群、医疗健康群等),3个微信群友地域群(北美、深圳和长三角),专业领域的群友多达上万人,联盟会员单位数百家,如国双科技、博彦科技、银联智策等。

91799b5cf5a2053c7c34cb077315efb89e85b244

部分合作企业

a798e2554bbacce510563be1baf734a1e4d5ed37

思享会现场

企业是社会最有活力的单位,而数据院培养的大数据人才最终也将融入到社会之中,业界联盟使校企双方在人才培养、科研和企业发展中真正实现了共赢。联盟成员单位有更多接触清华校内大数据师生的机会,让校内资源与企业对接;同时,企业也对数据院的各项活动也给予了大力支持,如2018年国双科技与数据院联手成功举办了司法RONG论坛,对大数据和人工智能在司法领域做了一次深入的探讨。

2018年,数据院依旧会为大家奉上更多精彩的干货,持续在校内外发出自己的声音,努力完成“让政府知道大数据的智库在清华、让企业知道大数据的优势在清华、让百姓知道大数据的知识在清华”的使命。同时,也感谢一直支持数据派的粉丝、支持我们活动的师生、听众和企业,相信有了你们的陪伴数据院的路会走得更加长远。

不依托于任何一家企业,不以盈利为目的,不论大数据潮起潮落,数据院的传播一直这样坚守。为什么?图什么?“只希冀在数据科学领域为清华的大数据持续发声,为读者提供更加优质的精神食粮。真正搭建起思想碰撞、学科交融的平台,让产学研用RONG为一体”。真正支持我们一直走下来的是每一次活动结束后参会听众的掌声,每一篇文章后台留言上的肯定和每一个与我们接触过的同学从容地走向业界的身影。

说到这里,又回到了上面的问题“这算不算刷存在感”?我依旧没办法得出答案,我能感受到的,是他们真实地带着梦想的存在。


原文发布时间为:2018-04-24

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
2月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
515 7
|
2月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
65 2
|
9天前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试
|
2月前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
113 1
|
3月前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
61 3
|
2月前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
115 4
|
2月前
|
存储 大数据 数据管理
大数据分区简化数据维护
大数据分区简化数据维护
31 4
|
2月前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
72 3
|
2月前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
96 2