数据可视化,我应从何开启?

简介:

我喜欢数据,并将它广为人知。

如果您最近和我参加聚会,我在您耳边说的都是有关数据可视化工具或者最近使用的酷R包,对此我在这向您表示歉意。

如果您和我玩范特西游戏,欢迎您来到图表世界,这里有很多的图表。

不要为越来越频繁地听到下面的问题感到惊讶:“Nick,我想走向数据分析和数据可视化,我应该从哪里开始?

不幸的是,没有一个完美的答案适合所有的人–每一个人的需求不同且人们已经知道的东西相差很大。但令我高兴的是一件关于最近科技/教育/商业环境事情:

来自不同职业道路和背景的聪明人都对自己说:“我需要从数据中得到更多”。

但是,在很多初学者沟通后,发现了的共性。很明显,这些共性不是适合每一个人的:

一个老练的工程师会嘲笑共性上说的第一时间学习Java脚本或者Python。

早已知道D3.js 的人会疑惑选择哪一个可视化工具?或者疑惑怎么样将数据驱动转换应用顶级的3D中?

这些适合想进一步了解接近数据可视化的学术科学家、学校老师、研究咨询师、项目经理、失业快乐族或者MBA毕业生……。

如果符合你,我认为你应该开始于从“无编码”有计划地学习到“爱编码”。

无编码

首先,如果你对excel一无所知,这是值得去做的。严肃地告诉你至少得学会透视表,听起来有些差劲,但是Excel能做很多超乎人们想象的事情。如果你善于尝试,Excel甚至能做出很多漂亮的图表。

如果你已经有一些数据,仅仅想用一个好的工具来探索可视化或者输出更多引人注目的图表。Tableau 就很流行、功能惊人,它有免费的公共版和一个十分昂贵费用的付费版,

不过如果你是学生就可以享受到免费版。它一般会在网上,或者论文上以静态图表形式发布,也可以传送到Instagram上或者以墙图输出。在它的官网上可以找到很多模板,激发你的灵感。

遗憾地是,将要探讨的另一个工具–Infoactive,可惜已经下架了,但没关系,Tableau吸收了Infoative所有优点。这个意味着Tableau很有可能是未来公认的好工具。我将牵头一本免费的书,它是Infoactive团队带领下涉及数据可视化设计工具的背景资料,下面谈论的任何工具:

数据+设计

一个简单有关准备和可视化信息的说明介绍

简单编码

如果要选择一款独立的程序语言来操作单机数据,我会选择R语言。因为R语言是免费的,且支持大量的在线开发加载有用的顶级基础语言程序包,并且有大量的免费资源学习如何运用它。在这些资源中–我极力推荐Coursera课程:

数据科学家证书|课程

约翰霍普金斯大学验证通过的数据科学专业化专家成为数据科学家自由谈论……

它们可能会抹杀一个真正的初学者,但是课程能带你走出一条重要数据科学项目和想法的路线,通过所有的方式探索数据分析(它涵盖了有用的R包,例如ggplot,一个十分受欢迎的可视化工具)的交互性,通过Shiny和数据故事发布在网页上。

R是我最常用来处理小型快速的分析和数据可视化工具–如果有一个数据(数据量大、不易于可视化)Excel处理不了,R最适合快速探索。

“是的,你可能要学些一些SQL”,另外一个快速入门的语言–SQL,与R相比(实际上,这已经超出了苹果和苹果的比较),SQL是一门比较有针对性的语言:

如果你希望在数据库中用任何工具或者语言集成数据,这将是一个很好的机会让你有学习SQL的兴趣。

爱编码

通常,在网页上看到一个美好的交互式可视化界面,都会浮现一个问题“我们要从何学起?”。我着迷于这个创新的领域(点击这可以看更多深入的调查)。

不幸地是,如果你喜欢这些作品:

一个机器学习的可视化介绍

让我们重新审视73英尺高的边界,提出了我们的建议,看看我们是怎样地提高直觉。明显地……

……它可以令你沮丧的发现还有多少东西需要自己学习。反复的实践以求得“《纽约时报》一样好”是一个艰难的目标,值得但是困难。

幸运的是,这里有很多帮助资源。

交互式的作品后面的逻辑库,和很多在网页上运行的数据可视化作品都是Mike Bostock创作的D3.js。D3.js是一个很好的工具去学习作品网页发布和交互式。

博斯托克(Bostock)的网站是一个有关金矿的例子和教程网站(你不需要筋疲力竭地从逻辑库的创建者学起……)。

我也推荐Murry创建的网页版交互式数据可视化,你可以从 O’Reilly 那购买或者网上在线免费使用:

网页交互式数据可视化

这是一个关于非程序员的编程数据可视化的书。如果你是一个拥有视觉技能的艺术家或图形设计师,但没有从事数据或代码工作的先验经验,这本书适合你。如果你是一个拥有大量数据的记者或研究人员,但没有数据可视化或代码的先验工作,这本书也适合你。

在线版本很好–你可以跟着书本本身编写代码脚本,运行它并拿你的输出结果和模板比较。Murray 还特别为初学者量身定制,这个网站能很好的引导初学者从HTML/CSS和Javascript基础到深入学习相对难的D3。

D3的地理空间可视化是一个值得一提的长处。D3擅长创造很多不同效果的地图,如果这是你的专业领域,这里可以获得不错的专用教程:

让我们画一个泡泡地图

我以前让地图教程介绍了如何用D3和topojson做一个基本的地图;现在是时候让它覆盖……

D3很难操作,但也有工具能降低难度,我建议使用最基础的D3而不是复杂的绘图程序,如果你人觉得棘手,那使用Plot.ly会更实际。

如果你要学万能的程序语言,那Python是最适合。它功能强大目的性强,很受欢迎。

我发现Python是一种极易上手且多用途的编程语言。但实际上,如果你要做的是探索和可视化数据,它会让你觉得吃力:例如Youtube就是用Python开发的……代码有一百万行。如果你想了解Python,Code Academy 课程是一个短且有趣的语言介绍。

最后,和前面介绍的D3.js , Javascript or ggplot ,R一样, Python也有很多资料库。最值得推荐的是,Seaborn(建立在一个年长受欢迎的库,matplotlib)和Bokeh很有可能是一流的,但是这是一个快速发展和提升的领域。Seaborn and Bokeh 的网站包括画廊展示你用这些工具创建的各种各样的可视化作品。


本文作者:佚名

来源:51CTO

相关文章
|
运维 监控 安全
应急实战 | 记一次日志缺失的挖矿排查
应急实战 | 记一次日志缺失的挖矿排查
388 0
|
存储 监控 Java
Java多线程优化:提高线程池性能的技巧与实践
Java多线程优化:提高线程池性能的技巧与实践
557 1
|
机器学习/深度学习 人工智能 物联网
.NET 技术:引领未来开发潮流
.NET 技术以其跨平台兼容性、高效的开发体验、强大的性能表现和安全可靠的架构,成为引领未来开发潮流的重要力量。本文深入探讨了 .NET 的核心优势与特点,及其在企业级应用、移动开发、云计算、人工智能等领域的广泛应用,展示了其卓越的应用价值和未来发展前景。
234 5
|
机器学习/深度学习 边缘计算 人工智能
深度学习的未来趋势与挑战
本文探讨了深度学习的最新进展和未来发展方向,并分析了当前面临的主要挑战。通过具体案例和研究数据,揭示了深度学习在多个领域的应用前景及其潜在问题。
|
云安全 监控 供应链
带你读《阿里云安全白皮书》(十)——云上安全重要支柱(4)
阿里云安全白皮书(2024版)介绍了零信任体系,通过全链路可信身份传递、多层纵深防御和持续监控,实现动态安全。同时,推出“安全分”机制,量化评估产品线的安全水平,提升安全管理效率。点击下载完整版内容。
|
机器学习/深度学习 人工智能 自然语言处理
AIGC的伦理考量与法律框架
【7月更文第27天】随着人工智能技术的发展,AI生成的内容(AIGC)已经广泛应用于各种领域,包括但不限于新闻写作、图像生成、视频制作等。这些技术的进步带来了巨大的经济效益和社会价值,但同时也引发了一系列伦理和法律问题。本文将探讨AIGC技术的关键组成部分,分析其伦理考量,并提出相应的法律框架建议。
507 7
|
安全 Java API
支付宝支付接口遇到的问题总结
支付宝支付接口遇到的问题总结
448 0
|
芯片 SoC
深入理解AMBA总线(零)绪论
深入理解AMBA总线(零)绪论
754 0
|
小程序 前端开发
微信综合购物商城小程序ui模板源码
微信电商小程序前端页面,综合购物商城ui界面模板。主要功能包含:电商主页、商品分类、购物车、购物车结算、我的个人中心管理、礼券、签到、新人专享、专栏、商品详情页、我的订单、我的余额、我的积分、我的收藏、我的地址、我的礼券等。这是一款非常齐全的电商小程序前端模板。
536 4
|
网络协议 安全 物联网
你还在用IPv4?揭秘IPv6的几大神秘优势,这些功能你掌握了吗?未来网络的发展全看它了!
【8月更文挑战第19天】随着IPv4地址资源耗尽,IPv6作为新一代互联网协议标准登场。IPv6提供近乎无限的地址空间(3.4x10^38个地址),简化数据包头部以提高处理效率,引入无状态自动配置机制使设备能快速接入网络,集成IPsec提升安全性,并优化移动性和多宿主支持。这些优势共同推动互联网基础设施升级,迎接未来挑战。
961 0