用艺术的眼光探索数据之美

简介: 独特的数据可视化技术,用于深入了解数据。当我们观想它时,它的美就显现出来了。

独特的数据可视化技术,用于深入了解数据。当我们观想它时,它的美就显现出来了。可视化是一种更方便的方式,可以一目了然地了解大量数据。在深入分析的情况下,我们应该用数据图形表示技术的思想。我们经常使用bar charts, histograms, pie charts, boxplots, heatmaps, scatter plots, line plots等等这些典型的图,这些图对于数据可视化是必不可少的。除了这些被广泛使用的情况外,还有许多精湛的情节却很少被使用。当我们考虑分析数据并以艺术方式表示时,这些图有助于发现洞察。

1 平行坐标图

实际上,我们最多可以可视化 3 维数据。但有时,我们需要可视化超过 3 维的数据才能获得洞察力。我们经常使用 PCA 或 t-SNE 来降维并绘制它。在降维的情况下,可能会丢失大量信息。在某些情况下,我们需要考虑所有需要,平行坐标图有助于做到这一点。

9cd38189f86637036c550b9f2b402d5e.png

看上面的图片。水平线(平行轴)代表鸢尾花的特征(Petal length, Sepal length, Sepal width, Petal width) 。类别是Setosa, Versicolor and Virginica。上图将物种编码为Setosa →1、Versicolor →2 和 Virginica →3。每个平行轴包含最小值到最大值(例如,花瓣长度从 1 到 6.9,萼片长度从 4.3 到 7.9,等等)。例如花瓣长度轴,表明该品种的花瓣长度Setosa 与其他两个品种相比较小,且Virginica 最高。所以,通过这张图,我们可以很容易地得到数据集的整体信息。

3ee57b71949c0b75ddd0d36b352f5f28.png

2 六角装箱图

六角装箱是用六边形二维数值的密度直观地表示数据点的过程。

3e224825baabe0ce9ccfa9581778c99e.png

利用上面的数据集来绘制的六边形分箱图。如果仔细观察,我们会发现总面积被分成了无数个六边形。每个六边形覆盖特定区域。我们注意到六边形有颜色变化。六边形有的没有颜色,有的是淡绿色,有的颜色很深。根据图右侧显示的色标,颜色密度随密度变化。比例表示具有颜色变化的数据点的数量。六边形没有填充颜色,这意味着该区域没有数据点。

3 等值线图

二维等高线密度图是另一种可视化特定区域中数据点密度的方法。这样做是为了找到两个数值变量的密度。例如,下图显示了每个阴影区域中有多少数据点落入。

0dc46e523d19b2000bcf69d84e17dd82.png

4 QQ-plot图

QQ 代表 Quantile — Quantile plot (Quantile/percentile 是一个范围,在这个范围内,指定百分比的数据已经下降。例如,第 10 个 quantile/percentile 表示在该范围下,找到了 10% 的数据,找到了 90%超出范围)。这是一种直观地检查数值变量是否服从正态分布的方法。

142266ad90b387a40a46742663d901a4.png

(a) 样本分布 (b) 标准正态分布

图(a)是样本分布;另一方面,(b)是标准正态分布。对于样本分布,数据范围为10 到 100 (100% 数据在 10 到 100 之间)。但对于标准正态分布,100% 的数据在范围内-3 到 3 (z-score)。在 QQ 图中,两个 x 轴值均分为 100 个相等的部分(称为分位数)。如果我们针对 x 和 y 轴绘制这两个值,我们将得到一个散点图。

fd42eac69d19134d2e96d7b6b4d0bd15.png

散点图位于对角线上。这意味着样本分布是正态分布的。但是,如果散点图位于左侧或右侧而不是对角线,则表明样本不是正态分布的。

5 小提琴图

小提琴图与箱线图相关。我们从小提琴图中获得的另一个信息是密度分布。简单来说就是一个结合了密度分布的箱线图。因此,让我们将其与箱线图进行比较。在小提琴图中,小提琴中间的白点表示中点。实心框表示四分位数间距 (IQR)。上下相邻值是异常值的围栏。超出范围,一切都是异常值。下图显示了比较。

56cd7e75623c4ade827676f73452e943.png

我们还可以通过传递列名来绘制不同物种的小提琴图。

8e1730ce4ea1451934d96cc42a41fcdb.png

6 旭日图

它是圆环图或饼图的定制化版本,将一些额外的层次信息集成到图中。

1c717800bb3d0380de90660999bb27e9.png

整个图表被分成一些环(从内侧到外侧)。它包含层次信息,其中内环位于层次结构的顶部,外环位于较低的顺序。

86380d9e1111146d94aa2e5107044ec5.png

如果我们仔细观察数据集,第一列包含一年的季度;每个季度下面有几个月,每个月有几个星期。上面的旭日图描述了这种情况。

小结

数据可视化是数据科学不可或缺的一部分。在数据科学中,我们探索数据。少量数据手动分析还好,但是当我们处理成千上万的数据时,它就变得非常繁重,有时甚至是不可能的。如果我们无法找出数据集的趋势和见解,我们可能无法使用该数据。希望上面的图可以帮助您从美学上可视化数据并深入了解数据。




目录
打赏
0
0
0
0
58
分享
相关文章
代码之美:从技术实现到艺术创作的思考
【7月更文挑战第26天】在数字世界中,代码是构建一切的基石。它不仅仅是冷冰冰的指令集合,更是连接人类思维与计算机执行的桥梁。本文将探讨如何通过技术实现提升代码的艺术性,使其不仅高效、可靠,同时也具备美感和创造性,从而让编程成为一种艺术创作过程。
代码之美:从技术实现到艺术创作
在数字化时代的浪潮中,编程不仅仅是冷冰冰的代码堆砌,它更像是一种艺术形式。本文将通过探索编程语言的设计哲学、算法的美学以及软件开发过程中的创新思维,揭示编程背后的深层美学价值和创造性思考。我们将一同走进程序员的内心世界,理解他们如何在严谨的逻辑与无限的可能性之间舞蹈,把枯燥的技术实现转变为令人赞叹的艺术创作。
代码的诗意:技术与艺术的交织
【6月更文挑战第28天】在数字世界的构建中,编程往往被视为一项枯燥且逻辑性强的技术活动。然而,当我们深入探究时,会发现编程不仅涉及逻辑和算法,还蕴含着一种独特的艺术美。本文将探讨编程如何融合技术性和艺术性,揭示代码背后的诗意及其对创造性思维的促进作用。通过个人的技术感悟,我们将看到,编程不仅是科技的产物,也是人类创造力的展现。
62 1
使用AI焕发那场亚运的精彩--给回忆增添色彩,对未来充满期待
1974年9月1日,第七届亚洲运动会在伊朗首都德黑兰的阿里亚梅尔体育中心的主体育场开幕,这是新中国首次参加亚运会。而今正值亚运110周年,第19届杭州亚运会即将举办。本次通过参与“历久弥新——用 AI 修复亚运会珍贵史料”活动,使用阿里云的 AI 技术对亚运会历史老照片进行修复,重燃亚运经典,为亚运助威。
683 8
Web前端开发:探索技术与艺术的交融
Web前端开发:探索技术与艺术的交融
90 1
视野修炼-技术周刊第65期 | 兴趣是一种天赋
🔥强烈推荐 1. 和尤大聊项目进展、开源社区协作和前端思考 围绕近期 Vue.js / Vite的技术变化、开源社区维护、前端未来发展的思考展开。也聊了一些轻松话题,比如:怎么看他被称呼尤大,祖师爷这个绰号?github 上yyx990803 神秘的数字是什么意思?Vue4 啥规划?未来是否有计划退休?写 Vue 用不用 Copilot?发际线如何保养等非技术话题。 这是音频内容,推荐对 Vue&Vite&尤大 感兴趣的同学听一下,干货挺多 尤大 Github(yyx990803) 账号这串数字是初中学号😄 很喜欢尤大最后说的一句话 ”兴趣是一种天赋“
人生道路,道阻且长,勇敢过好当下的生活
人生道路,道阻且长,勇敢过好当下的生活,努力让自己的选择正确,万维网利益链全媒体文化洗你脑没商量,网络公司全媒体工作就是这样编辑信息资源发布,利益链全球化经济懂得,分析正能量=什么是玄理论宇宙基因不知道的演化,政治经济割据历史无奈,总要有人去过滚烫的人生,年报乱象又是几年下来,所以把我们公司、个人银行账户封卷了,造假!什么都会造假,公知会收敛?顺应新媒体民族共同体理念体系,把利益链平衡l基因变异演化与技术和金融之间最不引人注目的中断可能最终成为最具革命性的中断来研究生存。https://mp.weixin.qq.com/s/28L5xhpBcJ4yVi9AuyGvjg
196 0
深度好文:一个30岁男人转型码农的平凡之路
  今天给大家带来的是一个转行的故事,一个30岁才开始学习编程的小白,资质平平,真正的零基础。   他的故事和那些大众喜欢的、夸张的、甚至虚假的华丽转身不同,一点也不精彩、一点也不鸡汤,平淡如水,但是能反映出大多数人的真实情况。   故事开始。   地点:上海   我曾经失落、失望、失掉所有方向   码农这个词,是我决定要学习编程的时候,我才知道是指程序员这么一个存在的。因为我本科的专业是液压应用,在毕业后的至少四年时间里,我一直都在从事于对口的工作,我对编程一类的人或事的了解程度,大概不会超过美国人对汉语的了解程度。
245 0
【云周刊】第162期:致敬史蒂芬·霍金!传奇谢幕,但人类对宇宙和科技的探索从未止步
致敬史蒂芬·霍金!传奇谢幕,但人类对宇宙和科技的探索从未止步,《金融时报》:中国巨头争夺企业级市场,阿里云份额已近六成,全面解读语音交互技术——Interspeech 2017...更多精彩内容,尽在云周刊!
7630 0
【云周刊】第162期:致敬史蒂芬·霍金!传奇谢幕,但人类对宇宙和科技的探索从未止步
不造AI杀人武器当然好,但牛津学者觉得马斯克们忽略了重点
牛津大学的学者Mariarosaria Taddeo (简称玛利亚) 说,他们忽略了一个重点。而且,把万众目光集中在“AI杀手”上,人们就更难注意到那个重点了。
1238 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等