数据分析写作——程序员的另外一种输出

简介:
  辛苦做了三年的数据分析软件,没人知道我,写了两篇文章,倒引来了大量的关注。
写文章的目的
     写文章的理由可能有很多,对我来说,内外扩展交际圈,提高个人知名度的重要手段。对内能锻炼文笔,完善逻辑思维能力,从而能形成完整闭环。只不过写文章对我来说,真没那么轻松,从构思到提笔,到最后的修订,每个步骤都需要大量的耐心和对细节的把握。数据分析文章更是如此,三天完成一篇文章就不错了。
     不过,在看到无数人向我发出反馈,对我关注并提意见时,那种感觉相当不错,比打游戏带来快乐的多多了。所以一定要写下去。
读者群体
     读者数量多固然很好,但对我的目的来说,质量比数量更重要。也许未来改变我人生的那个人,就是我其中一篇文章的读者。
     现在读者培养出了“一眼”看出内容到底是否有价值的能力,也变得越来越没有耐心了 。读者会点击链接,在看第一句话和几张图后,快速决定阅读的策略。最可能快速地下翻,只看观点。也有一部分人,对本文特别感兴趣,就会仔细地阅读。
     移动互联网时代,最重要的资源是注意力,不要抱怨读者没有耐心,读者的手指已经投票了。从阅读方式就足以过滤出目标读者。一篇好文章,不怕没人看,就怕写不出来,能成功抓住几万人10分钟的注意力,就已经非常成功了。因此我针对的阅读群体是,IT,信息和金融相关的高素质从业人员。
数据分析的特点
     鸡汤文无毒但有害,各类段子浪费时间无营养,养生健康文章满天飞。读者都在渴望真正的干货。数据分析提供了一种手段,避免了夸夸其谈。能从复杂的数据中抽取真正关键的观点和洞见。这种手段是很有吸引力的。针对国计民生,地铁交通,房价,教育,人口变迁,商场分布,可谓受众极广。分析的角度亦可多变,进而得到丰富的结论。
     打个比方说,像我的父母辈,会发现面向50岁左右的消费人群的购物商场并不太好找。凯德大悦城针对年轻人,西单燕莎价格高昂。写出一篇中老年人在北京的购物攻略,应该会很有意思。
数据分析的几个层次
     我罗列了数据分析的几个层级。
     第一维度:排序,过滤,转换。通常用列表形式展现。
     第二维度:分组,聚合。通常用直方图,饼状图等展现,也是常规数据分析最常用也最容易理解的方式。
     第三维度:关系。 例如聚类,分类,复杂网络。通常需要N平方的计算复杂度。但能提供更高维度的可视化思路。
     第四维度:时间序列。改变才是最大的不变,分析随时间变化的参量,尝试发现规律并预测规律。
     第五维度:?待补充吧。
不仅是数据,更要观点
     数据和真理,本身是无趣的。你需要将其包装上漂亮的外衣。因此仅仅一两句总结的话显然是不够的。你需要告诉读者,为什么是这个样子?它带来了怎样的后果?乃至它周边的段子。新闻式的写作风格并不适合于微信文章。
     对其感兴趣的人,必然已有一定的知识储备,若想真正吸引这些读者,就需要比他们站在更高的层级上去看问题。因此写文章前,必须对话题相关的文章进行大量的阅读,形成立体而丰富的观感。如果没有相关知识,很容易给出令专业人员啼笑皆非的结论。
不仅要观点,还要建议
     很多读者会有疑问,“我看了这篇文章之后,能对我产生怎样的用处呢?”。例如,房价分析应该给出适合买房的商区位置,购物攻略应推荐物美价廉的商场。地铁分析应该给出换乘的策略。然而,给出合理的建议会更加困难,需要大量的人工分析。
     至于预测,我敢吗?现在不敢。
是否需要故事?
     写了两篇文章,第一篇只有干巴巴的图表和结论,在当时寥寥无几的关注者情况下 获得了五千的阅读量。第二篇花了我多得多的时间,包装了还算可以的故事来串起整个分析流程,却仅仅有两千的阅读。但身边人反馈给我的是,第二篇更好!那到底第二篇好还是第一篇好呢?我倒是很想针对这类问题做一次分析。然而数据量实在太小,难以成文。
     从目前来看,风趣幽默,问题驱动的文章应该是首选。文章少了很多包袱,简单易读,更重要的是好写啊!
我渴望有人与我讨论
     在写文章时,我故意不修改一些很明显的错误,期待有人指出来。不幸的是,没有人给我反馈,也许看到的人没时间告诉我吧。有读者会找我进行有趣的线下交流,让我认识了大量的新朋友,并获得了新的机会。
缜密的思维,考虑读者的感受
     这是我在写文章中获得的最大收获。我尽可能通过完整的逻辑,将整篇文章串起来,符合问题的分析思考规律。同时尽量考虑读者的感受,他们会喜欢看这一段吗?我该怎么修改?
结语
     真正的好文,一眼就能看出来。每一句话都透露着作者的真知灼见,没有一两个礼拜写不出来。我是不是该去主动看看穷经皓首才写成的学术论文呢?我也期待通过写作,能给我带来更多正向的改变。
相关文章
|
移动开发 HTML5
分组元素
分组元素。
95 3
|
弹性计算 虚拟化 KVM
Intel Xeon E5-2682 V4 (Broadwell) 2.5 GHz 性能评测 阿里云ECS服务器
Intel Xeon E5-2682 V4 (Broadwell) 2.5 GHz 性能评测 阿里云ECS服务器 阿里云 优 惠 地 址 https://promotion.aliyun.com/ntms/yunparter/invite.html?userCode=q3dtcrrv 阿里云ECS服务器是一种弹性可伸缩的云服务器,通过虚拟化平台将服务器集群虚拟为多个性能可配的虚拟机(KVM),对整个集群系统中所有KVM进行监控和管理,并根据实际资源使用情况灵活 分配和调度资源池。
11546 2
|
消息中间件 监控 Java
实时计算 Flink版产品使用问题之该如何解决checkpoint频繁失败
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
tengine 网络协议 Linux
关于长连接服务器和客户端之间要加入心跳的一些讨论
关于长连接服务器和客户端之间要加入心跳的一些讨论
DC电源模块技术的未来发展趋势可能包括以下几个方面
DC电源模块技术的未来发展趋势可能包括以下几个方面:
DC电源模块技术的未来发展趋势可能包括以下几个方面
|
SQL 缓存 关系型数据库
你分得清MySQL普通索引和唯一索引了吗?
普通索引和唯一索引 普通索引可以重复,唯一索引和主键一样不能重复。 唯一索引可以作为数据的一个合法验证手段,例如学生表的身份证号码字段,我们人为规定该字段不得重复,那么就使用唯一索引。(一般设置学号字段为主键) 主键和唯一索引 主键保证数据库里面的每一行都是唯一的,比如身份证,学号等,在表中要求唯一,不重复。唯一索引的作用跟主键的作用一样。 不同的是,在一张表里面只能有一个主键,主键不能为空,唯一索引可以有多个,唯一索引可以有一条记录为空,即保证跟别人不一样就行。 比如学生表,在学校里面一般用学号做主键,身份证则弄成唯一索引;而到了教育局,他们就把身份证号弄成主键,学号换成了唯一索引。 选谁做
9132 0
你分得清MySQL普通索引和唯一索引了吗?
|
消息中间件 云安全 人工智能
前沿·探索·想象力,今年的云栖大会有啥不一样?
足足四天,两场主论坛,上百场分论坛,四大场馆会展一体,打造“云栖数字谷”,再加码互动探展沉浸体验,诚意满满,惊喜无限。
前沿·探索·想象力,今年的云栖大会有啥不一样?
|
弹性计算 JavaScript 数据可视化
使用ECS配置部署node.js项目体验
使用ECS配置部署Nodejs的项目,熟悉了部署阿里云服务器流程,终端操作服务器的一些命令,以及在终端服务器上配置所需要的nodejs环境。
|
安全 Linux 数据安全/隐私保护