我喜欢数据,并将它广为人知。
如果您最近和我参加聚会,我在您耳边说的都是有关数据可视化工具或者最近使用的酷R包,对此我在这向您表示歉意。
如果您和我玩范特西游戏,欢迎您来到图表世界,这里有很多的图表。
不要为越来越频繁地听到下面的问题感到惊讶:“Nick,我想走向数据分析和数据可视化,我应该从哪里开始?
不幸的是,没有一个完美的答案适合所有的人–每一个人的需求不同且人们已经知道的东西相差很大。但令我高兴的是一件关于最近科技/教育/商业环境事情:
来自不同职业道路和背景的聪明人都对自己说:“我需要从数据中得到更多”。
但是,在很多初学者沟通后,发现了的共性。很明显,这些共性不是适合每一个人的:
一个老练的工程师会嘲笑共性上说的第一时间学习Java脚本或者Python。
早已知道D3.js 的人会疑惑选择哪一个可视化工具?或者疑惑怎么样将数据驱动转换应用顶级的3D中?
这些适合想进一步了解接近数据可视化的学术科学家、学校老师、研究咨询师、项目经理、失业快乐族或者MBA毕业生……。
如果符合你,我认为你应该开始于从“无编码”有计划地学习到“爱编码”。
无编码
首先,如果你对excel一无所知,这是值得去做的。严肃地告诉你至少得学会透视表,听起来有些差劲,但是Excel能做很多超乎人们想象的事情。如果你善于尝试,Excel甚至能做出很多漂亮的图表。
如果你已经有一些数据,仅仅想用一个好的工具来探索可视化或者输出更多引人注目的图表。Tableau 就很流行、功能惊人,它有免费的公共版和一个十分昂贵费用的付费版,
不过如果你是学生就可以享受到免费版。它一般会在网上,或者论文上以静态图表形式发布,也可以传送到Instagram上或者以墙图输出。在它的官网上可以找到很多模板,激发你的灵感。
遗憾地是,将要探讨的另一个工具–Infoactive,可惜已经下架了,但没关系,Tableau吸收了Infoative所有优点。这个意味着Tableau很有可能是未来公认的好工具。我将牵头一本免费的书,它是Infoactive团队带领下涉及数据可视化设计工具的背景资料,下面谈论的任何工具:
数据+设计
一个简单有关准备和可视化信息的说明介绍
简单编码
如果要选择一款独立的程序语言来操作单机数据,我会选择R语言。因为R语言是免费的,且支持大量的在线开发加载有用的顶级基础语言程序包,并且有大量的免费资源学习如何运用它。在这些资源中–我极力推荐Coursera课程:
数据科学家证书|课程
约翰霍普金斯大学验证通过的数据科学专业化专家成为数据科学家自由谈论……
它们可能会抹杀一个真正的初学者,但是课程能带你走出一条重要数据科学项目和想法的路线,通过所有的方式探索数据分析(它涵盖了有用的R包,例如ggplot,一个十分受欢迎的可视化工具)的交互性,通过Shiny和数据故事发布在网页上。
R是我最常用来处理小型快速的分析和数据可视化工具–如果有一个数据(数据量大、不易于可视化)Excel处理不了,R最适合快速探索。
“是的,你可能要学些一些SQL”,另外一个快速入门的语言–SQL,与R相比(实际上,这已经超出了苹果和苹果的比较),SQL是一门比较有针对性的语言:
如果你希望在数据库中用任何工具或者语言集成数据,这将是一个很好的机会让你有学习SQL的兴趣。
爱编码
通常,在网页上看到一个美好的交互式可视化界面,都会浮现一个问题“我们要从何学起?”。我着迷于这个创新的领域(点击这可以看更多深入的调查)。
不幸地是,如果你喜欢这些作品:
一个机器学习的可视化介绍
让我们重新审视73英尺高的边界,提出了我们的建议,看看我们是怎样地提高直觉。明显地……
……它可以令你沮丧的发现还有多少东西需要自己学习。反复的实践以求得“《纽约时报》一样好”是一个艰难的目标,值得但是困难。
幸运的是,这里有很多帮助资源。
交互式的作品后面的逻辑库,和很多在网页上运行的数据可视化作品都是Mike Bostock创作的D3.js。D3.js是一个很好的工具去学习作品网页发布和交互式。
博斯托克(Bostock)的网站是一个有关金矿的例子和教程网站(你不需要筋疲力竭地从逻辑库的创建者学起……)。
我也推荐Murry创建的网页版交互式数据可视化,你可以从 O’Reilly 那购买或者网上在线免费使用:
网页交互式数据可视化
这是一个关于非程序员的编程数据可视化的书。如果你是一个拥有视觉技能的艺术家或图形设计师,但没有从事数据或代码工作的先验经验,这本书适合你。如果你是一个拥有大量数据的记者或研究人员,但没有数据可视化或代码的先验工作,这本书也适合你。
在线版本很好–你可以跟着书本本身编写代码脚本,运行它并拿你的输出结果和模板比较。Murray 还特别为初学者量身定制,这个网站能很好的引导初学者从HTML/CSS和Javascript基础到深入学习相对难的D3。
D3的地理空间可视化是一个值得一提的长处。D3擅长创造很多不同效果的地图,如果这是你的专业领域,这里可以获得不错的专用教程:
我以前让地图教程介绍了如何用D3和topojson做一个基本的地图;现在是时候让它覆盖……
D3很难操作,但也有工具能降低难度,我建议使用最基础的D3而不是复杂的绘图程序,如果你人觉得棘手,那使用Plot.ly会更实际。
如果你要学万能的程序语言,那Python是最适合。它功能强大目的性强,很受欢迎。
我发现Python是一种极易上手且多用途的编程语言。但实际上,如果你要做的是探索和可视化数据,它会让你觉得吃力:例如Youtube就是用Python开发的……代码有一百万行。如果你想了解Python,Code Academy 课程是一个短且有趣的语言介绍。
最后,和前面介绍的D3.js , Javascript or ggplot ,R一样, Python也有很多资料库。最值得推荐的是,Seaborn(建立在一个年长受欢迎的库,matplotlib)和Bokeh很有可能是一流的,但是这是一个快速发展和提升的领域。Seaborn and Bokeh 的网站包括画廊展示你用这些工具创建的各种各样的可视化作品。
本文作者:佚名
来源:51CTO