对话 | 薛娅菲:从0到1,行则将至

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

62a6cf0471f119bc5f79102e32bb6da385e23a22

数据之美

当周围变得安静,思维的敏感度就出来了。做新媒体的感觉,就像是迷雾中寻找方向,还时不时会撞墙。

“我第一次来到清华大学数据科学研究院见到韩亦舜老师,他让我看了《浪潮之巅》那本书。说看完了再给他打电话,说说自己的想法。我当时也刚毕业不久,是把这个当成作业来对待的。可能因为自己的商科学习经历吧,我就从‘数据应用场景’这个角度说了说自己的看法,现在想想觉得当时想法很稚嫩。但感谢韩老师,他还是给我了这个机会来到这里。”

对于文科出身的娅菲来说,最初的工作开展并不顺利。陌生的环境,零专业背景,加上人手稀缺,娅菲经常希望自己可以变成好几个人。“那种感觉就像是在武侠电视剧里,高手对决的时候,经常会一人变成好几个人把对手围成一圈,对我当时就希望可以有那么多个自己,一个学习、一个工作、一个去social。”都说有多少次希望,就有多少次放弃的念头。“每次我想放弃的时候,就回头看看韩老师。想想他为什么要来到这里?其实这个问题困扰了我很久,他年近花甲,事业也算成功,他不需要再图名再图利,那么他来这干什么?直到有一天他给我讲了大数据这件事儿的意义。说他有一次去医院,看到现在医学的传授方式还是传统的师父带徒弟,手把手教,庞大的数据储存都没用得上。他感到特别失望和难过,他说学以致用,然而产学研却无法真正融合。学科交融,然而大数据相关的研究技术却没办法以应用落地,他说这是我们的问题,他要解决这个问题,他的情怀在这。”娅菲说,正是这句话,让她坚信自己做的事情是有意义的。“我知道我做的不是‘小我’的事情,市场传播这件事儿虽然好多人看起来意义不大,但也是至关重要的一环。”

数据派刚刚建立的时候,谁也不知道这条路该怎么走。如何传递有深度、有见地的大数据知识,是娅菲面临的第一个难题。“然后我就去请教了新闻与传播学院的金兼斌老师,他从传播和媒介的方面给我了我非常多的指导。他的一个研究生和三个本科生也非常认可我们的模式和理念,在2015年那个寒假,跟着我一起做了SWOT分析,设计出了我们以后要发什么样的内容、以什么频率发等等。他们四个人后来也是清华大学学生大数据协会的骨干,也是从那个时候开始,我发现自己不是一个人了。所以我特别感谢金老师。”

“那时还是2014年,大数据和人工智能等话题兴起不久的一年,不管是网易/腾讯这个门户网站的科技频道,还是大数据行业的KOLs(自媒体),大家都在摸索未来的路该怎么走。数据派最初就是借助数据院讲座和论坛的资源,进行干货整理。来出席我们讲座和论坛的,都是大数据领域的专家、老师和行业领军人物,所以对我来说是个非常好的学习机会,他们的演讲也给数据派提供了很好的内容素材。”就这样,数据派跨出了新媒体运营的第一步。

0360994e15930987d3d0bc0fcb8affdc96e597cd

下班时间之后,是薛娅菲最喜欢的时段。“当周围变得安静,思维的敏感度就出来了。做新媒体的感觉,就像是迷雾中存着方向,还时不时会撞墙。最开始的时候不知道受众分析是否精准、内容方向是否正确、花费的时间是否值得的,只能不断地尝试。”而在这个过程中,对内容的把关对娅菲来说,才是最难所在。

逻辑严谨的胜利

原来我这不是一份没有意义的工作,原来大家真的在看啊,在一个字一个字地看。

在娅菲的工位上,有一摞笔记本吸引了我的注意。

3b9f371d1e70890af611b7b0d2787a627d221a23

“反正不是会议纪要就是to do list,再有就是一些读书随笔。有时候会觉得这三年多过的特别快,经常会想不起来自己都做了什么。我就翻翻这些笔记,也就知道了。” 在经得她的同意后,我翻开了其中一本,上面用荧光笔写着几个大字:“文!章!要!精!读!三!遍!才!能!发!

从前,娅菲一个人要盯选题的策划、采访、出稿、校对、美化、编辑、数据统计等前后期所有的事情,所以出错在所难免。“在大牛云集的清华做事,如果少了严谨这两个字,自己都会脸红。最开始发的文章经常会出现一些错误,虽然都是很小的细节,但是老师还有师兄师姐都会很耐心地给我指出来。甚至杨斌老师直接给我留言说:‘娅菲你这个怎么又写错啦?’然后我就突然觉得,原来我这不是一份没有意义的工作,原来大家真的在看啊,在一个字一个字的看。开心的同时也不断检讨自己,逼着自己向老师前辈们学习,严谨求实、行胜于言。”娅菲后来将自己的工作称之为“工匠”,态度是基础,能力是关键。

在工作中,娅菲最不喜欢的就是“蛮干”,她更喜欢“聪明+有一点慵懒”的感觉,我理解这句话的意思就是效率很重要。“我后来发现自己的工作量实在是太大了,就去找经管学院的老师请教,如何才能为自己的部门建立一个有效且快节奏的system。老师们同样给我了很多建议和帮助,在他们的指导下,我也参考了别的组织的模式,建立了有点‘奖励’的志愿者模式。”

数据派校对组是第一个成立的,娅菲说之所以成立一是想让学生志愿者们有机会精读文章加强学习,二也是绝不能容忍细节性的错误。“生生被清华精神感染了强迫症。”随后,以优选全网高质量文章的“选文组”、专翻译国外优质学术论文的“翻译组”、为数据派的文章提供视觉优化的“美编组”、与各行业媒体保持密切沟通的“运营组”以及“线下活动支持组”相继建立,形成了如今数据派的运营雏形。

92947b8657de361627f307e73be4b57227e01ca9

然而就算是这样,薛娅菲有时还是力不从心。“因为数据派两个号,每天早7:00和晚7:00都要发帖,这么大的发帖量,就需要大量的内容。所以我们经常去听老师们在讲座、论坛中的发言,录音后回来整理成文字的形式,再麻烦老师帮忙审核。但是由于我和志愿者们在大数据领域的学习还都是菜鸟,所以整理出来的有时会词不达意,就会被老师们批评不专业。直接跟我说,小薛啊我觉得你这么做可不太好啊,你们是代表清华在向社会做大数据方面的科普啊,怎么可以这么不严谨,而且这文风也不行啊,批评的声音很多。”

我问她委屈吗,她抽抽鼻子说不委屈,像极了我们还在上学期间刚从老师办公室回来的优等生,咬着牙努力往前走,但是还是被批评了。“本身来讲,我们算是科技领域的自媒体。一方面,我们对接着这个领域中,中国乃至全世界最一流的老师给我们的最顶尖的内容;但是另一方面,我们面对的群体,又基本上都是小白,他们有刚入门的学生、有从事企业管理需要了解大数据领域的从业人士,数据派这个平台对他们来说是一个途径,了解顶层设计和产业应用的方式,大数据到底是什么?到底好在哪?未来形态到底是什么?能给企业和从业人员带来什么改变?这些是他们关心的问题。所以我们需要把高屋建瓴的一些东西变得通俗易懂一些。不过以上这些都是站在传播的角度,但是作为一个学术的宣传平台,我们确实需要学习更多,所以我们也在努力改进。”

柔与韧

如果我处在韩老师的位置上,可能我都不会允许我的下属用自己50%时间来做一件几乎不会成功、就算成功了也没那么大影响力的事情。

除了娅菲刚刚提到的配合数据派运营的选文组、翻译组、校对组等,我还知道有一个优秀的组织—研究部。“我当时成立研究部的初衷很简单,就是弥补上述所说的不足。数据派的工作人员以及大部分志愿者们,都是抱着对大数据及人工智能的满腔热性来到这里,但是难以逾越的就是专业背景上的不足,但是老师们通常都很忙,很多学术上的东西我们不可能事事都找老师指导,所以就希望通过把更多行业内或是专业的人聚拢到一起,为我们提供学术方面的审核和支持,也为他们提供一个相互交流的平台。”

然而回头想来,娅菲自己都觉得当时的想法“很不靠谱”。

“最初的问题是志愿者招募,这比我想象的还要艰难得多。这个时代想要靠情怀做点什么事儿还是挺难的,”可能是回忆起以前的事情,娅菲的视线变得有点飘忽。对于研究部志愿者来说,大家都有各自的学业及工作,没办法投入太多的精力来做这些事情,因此,如何真切地给大家收获、调动大家积极性对于娅菲来说也是个棘手的问题。“后来我就什么招数都用上了,比如‘卖我自己’。那篇文案写的特别逗,好多人也都帮我转发,阅读量蹭蹭往上涨,报名加入研究部的人也越来越多,给我开心坏了。很多事情就是你去尝试才会有结果。”

“现在想想当时特别感谢韩老师,因为如果我处在他的位置上,可能我都不会允许我的下属用自己50%时间来做一件几乎不会成功、就算成功了也没那么大影响力的事情。可是他不仅让我放手去做,还参加了我们研究部的第一次全体会,为我站台。”

如今研究部已经成立近两年的时间了,从最初跟着志愿者们一起淌模式,到如今有规模有体系的组织,娅菲感慨良多。“现在研究部主要有100+志愿者,分为了三个组,分别是项目组、比赛组以及知识梳理组。项目组的志愿者大多是在校生,所以我们把企业的真实数据给到他们,让他们以团队的形式进行数据处理及分析,解决企业的实际问题,为教学环节做了很好的补充;同时,我们组织比赛组的志愿者们分别参加Kaggle和天池的比赛,通过老带新、理工带文科的方式,让大家提高跨学科学习的能力,他们的比赛经验我们也整理出来,让数据派的读者参考;最后的知识梳理组分别有自然语言处理、计算机视觉以及数据挖掘三个方向,这个组的成员几乎全是相关领域的在读博士,我希望他们能够利用好数据院的各类学术资源,以应用为线索完成不同方向知识的系统性梳理,逐步完成学术积累并进一步孕育学术氛围,为数据派添砖加瓦的同时,也能够成为真正被社会、企业认可的大数据人才。

10ddb517871da4ebbaad5399d367a0ab576db056

现在数据派研究部在部长王明哲的带领下,正在稳步前进。“之前其实都做好了心理准备,打算自己抗一段时间了,直到遇到了王明哲。我也觉得自己挺幸运的,一路上都能够在关键的时间点,遇到合适的那个人。” 

9b9370b39ad5d86f67bc2406bf1764485dc2aa2e

研究部小伙伴们合影

诗与远方

沿着荷塘,是一条曲折的小煤屑路。这是一条幽僻的路;白天也少人走,夜晚更加寂寞。

在电影《无问西东》中,开篇有这样一句话:“如果提前了解你们所要面对的人生,不知你们是否还会有勇气前来。”在采访之前,我本想问她:“如果有机会让你回到2014年,你还会选择这里吗?还会选择数据派吗?”现在我觉得这句话不用问,她的心在这里,她工作以来的全部都在这里。所以话到嘴边,我换成了这样一个问题。

“你觉得自己牛吗?”

我觉得自己挺牛的,但我说的这个牛不是指数据派运营得多好,线下活动举办得多成功,而是我觉得自己是运气好。在风口到来之际,幸得师长授业解惑;在困境来临之际,幸获前辈帮助扶持;新媒体运营道阻且长,幸有同仁朝夕相伴。”好吧,感性的薛老师又掉眼泪了。

8a08e889eb33f51521e4fbfb2fbe0b468ff341c4

伴随着采访走入尾声,娅菲提出带我去清华园走走,我欣然前往。这会儿已是近半夜的时间了,清华园里更显静谧。走到一处时,我心动了一下,蓦地想到了自小遍看过的《荷塘月色》。娅菲的声音适时响起:“这里便是朱自清先生写《荷塘月色》的地方,”她碎碎念着,我也跟着她默默念着:“沿着荷塘,是一条曲折的小煤屑路。这是一条幽僻的路;白天也少人走,夜晚更加寂寞。荷塘四面,长着许多树,蓊蓊郁郁的。路的一旁,是些杨柳,和一些不知道名字的树。”她突然回过头看我说,走我带你去看看清华历史最悠久的地方。

这时候的她,与我在伟清楼见到的薛老师好像不是一个人。我隐约记得她刚才编辑的那篇文章题目是《一文读懂卷积神经网络》。“从CNN到荷塘月色,这思维跳跃地有点大啊。”我笑问。

所以说,学习的路还很远呐!

62d7f67664d32b46e116a3efc89a753af9ce7a03


原文发布时间为:2018-01-30

本文作者:王睿诗

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
人工智能 自然语言处理 搜索推荐
如何让智能客服像真人一样对话?容联七陌揭秘:多Agent大模型
科技云报到原创。 经历了多年的“答非所问”、“一问三不知”,很多人已经厌倦了所谓的“智能客服”。哪怕是技术已经非常成熟、可以模拟真人发音的外呼机器人,也会因为“机感”重而被用户迅速挂机或转向人工客服。 智能客服似乎遇到了一道坎,在理解用户、和用户对话方面,始终无法实现真正的“智能”。然而大模型技术的出现,让智能客服看到了前所未有的曙光——基于大模型特有的生成式技术和智能的涌现,让智能客服越来越逼近人们想象中的样子。 但问题是,仅有大模型就够了吗?大模型技术要如何引入智能客服才能落地?落地后的大模型究竟如何在智能客服具体场景中发挥作用?又能为客服行业带来了哪些改变?更进一步,对于企业和
319 1
如何让智能客服像真人一样对话?容联七陌揭秘:多Agent大模型
|
3月前
|
人工智能
Agent应用对话情感优化
【10月更文挑战第2天】
64 0
Agent应用对话情感优化
|
5月前
|
机器人 TensorFlow 算法框架/工具
智能聊天机器人
【8月更文挑战第1天】智能聊天机器人。
120 2
|
6月前
|
自然语言处理 并行计算 Python
千问大模型对话
该段Python代码演示了如何使用`modelscope`库加载预训练的因果语言模型`Qwen2-1___5B-Instruct`到CUDA设备,并进行文本生成。首先,它定义了设备为`cuda`,然后加载模型和分词器。接着,设置了一个聊天情境并准备输入文本。通过调用`tokenizer.apply_chat_template`处理输入,然后将处理后的文本转化为模型输入张量并传入设备。使用`model.generate`方法生成新的文本,截取生成的输出并解码为人类可读的字符串。最后,打印出生成的响应。
165 6
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
ChatGPT:开启智能对话的未来
ChatGPT:开启智能对话的未来
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
对于 OpenAI 最新发布 支持实时语音对话的模型GPT-4o,你想说什么?
【6月更文挑战第4天】对于 OpenAI 最新发布 支持实时语音对话的模型GPT-4o,你想说什么?个人关于 OpenAI 最新发布的支持实时语音对话模型的 GPT-4o 想说的内容
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
聊天机器人
聊天机器人
167 4
|
8月前
|
自然语言处理 算法 机器人
做一个基于 chatterbot 的聊天机器人
做一个基于 chatterbot 的聊天机器人
113 0
|
人工智能 搜索推荐 算法
ChatGPT:一款非常强大的对话机器人的相关介绍和传送门
目前大家对ChatGPT的好奇非常火爆,但如何向身边的人介绍ChatGPT是什么,有多么的awesome却比较难,因为使用起来有门槛,一方面需要国外的账号注册,另一方面需要比较好的英语功底。 所以本文收集一些国内外网友使用ChatGPT的一些案例,和一些传送门,让大家都更方便的认识到它。 ### 一、ChatGPT是什么 首先ChatGPT是一个**问答机器人**,在2022年12月1日Op
1386 1
ChatGPT:一款非常强大的对话机器人的相关介绍和传送门
|
人工智能 自然语言处理 Java
【如何实现多轮对话 】新增查空气质量的意图,实现多轮对话|学习笔记
快速学习【如何实现多轮对话 】新增查空气质量的意图,实现多轮对话