Pandas数据可视化(二)

简介: **Pandas数据可视化教程聚焦于双变量分析,如散点图和堆叠图。散点图用于揭示两个变量间的关联,例如价格和评分,较大的点可能表示价格更高的葡萄酒得分更高。当数据过多时,可使用hexplot减少过度绘制,提供密度信息。堆叠图适合展示类别变量的分布,如不同葡萄酒类型的评分分布,显示了Chardonnay等品种的受欢迎程度。**

Pandas数据可视化(一)+https://developer.aliyun.com/article/1543876?spm=a2c6h.13148508.setting.16.1fa24f0eEjX8nS



Pandas 双变量可视化


数据分析时,我们需要找到变量之间的相互关系,比如一个变量的增加是否与另一个变量有关,数据可视化是找到两个变量的关系的最佳方法;


散点图


最简单的两个变量可视化图形是散点图,散点图中的一个点,可以表示两个变量


reviews[reviews['price'] < 100].sample(100).plot.scatter(x='price', y='points’)


调整图形大小,字体大小,由于pandas的绘图功能是对Matplotlib绘图功能的封装,所以很多参数pandas 和 matplotlib都一样


reviews[reviews['price'] < 100].sample(100).plot.scatter(x='price', y='points',figsize=(14,8),fontsize = 16)


修改x轴 y轴标签字体




上图显示了价格和评分之间有一定的相关性:也就是说,价格较高的葡萄酒通常得分更高。



散点图最适合使用相对较小的数据集以及具有大量唯一值的变量。 有几种方法可以处理过度绘图。 一:对数据进行采样 二:hexplot(蜂巢图)


hexplot


hexplot将数据点聚合为六边形,然后根据其内的值为这些六边形上色:





上图x轴坐标缺失,属于bug,可以通过调用matplotlib的api添加x坐标:




该图中的数据可以和散点图中的数据进行比较,但是hexplot能展示的信息更多


从hexplot中,可以看到《葡萄酒杂志》(Wine Magazine)评论的葡萄酒瓶大多数是87.5分,价格20美元 Hexplot和散点图可以应用于区间变量和/或有序分类变量的组合。


堆叠图(Stacked plots) 


 

  • 展示两个变量,除了使用散点图,也可以使用堆叠图


  • 堆叠图是将一个变量绘制在另一个变量顶部的图表


  • 接下来通过堆叠图来展示最常见的五种葡萄酒



从结果中看出,最受欢迎的葡萄酒是,Chardonnay(霞多丽白葡萄酒),Pinot Noir(黑皮诺),Cabernet Sauvignon(赤霞珠),Red Blend(混酿红葡萄酒) ,Bordeaux-style Red Blend (波尔多风格混合红酒)


从数据中取出最常见的五种葡萄酒:



通过透视表找到每种葡萄酒中,不同评分的数量 :




从上面的数据中看出,行列分别表示一个类别变量(评分,葡萄酒类别),行列交叉点表示计数,这类数据很适合用堆叠图展示




折线图在双变量可视化时,仍然非常有效


wine_counts.plot.line()



相关文章
|
11月前
|
数据可视化 Python
python开发低代码数据可视化大屏:pandas.read_excel读取表格
python开发低代码数据可视化大屏:pandas.read_excel读取表格
236 0
|
7天前
|
数据可视化 数据挖掘 API
Pandas数据可视化(一)
Pandas是Python数据分析的核心库,不仅用于数据加载和转换,还内置了简单的数据可视化功能。通过`.plot()`方法,可以创建条形图、折线图、直方图和饼图等,便于单变量分析。例如,用葡萄酒数据集展示了不同产区的葡萄酒数量,加利福尼亚占比最高。条形图适合比较类别间的差异,折线图则用于显示趋势。直方图用于数值分布,但对倾斜数据(极值影响)敏感。饼图展示类别占比,但不适用于大量分类。Pandas的可视化帮助我们理解数据集的结构和特征。
|
11月前
|
JSON 数据可视化 数据挖掘
python数据可视化开发(2):pandas读取Excel的数据格式处理(数据读取、指定列数据、DataFrame转json、数学运算、透视表运算输出)
python数据可视化开发(2):pandas读取Excel的数据格式处理(数据读取、指定列数据、DataFrame转json、数学运算、透视表运算输出)
290 0
|
1月前
|
数据可视化 数据挖掘 定位技术
《Pandas 简易速速上手小册》第9章:Pandas 数据可视化(2024 最新版)
《Pandas 简易速速上手小册》第9章:Pandas 数据可视化(2024 最新版)
50 2
|
1月前
|
JSON JavaScript 数据可视化
数据可视化:将Python的Pandas与Vue结合展示交互式图表
【4月更文挑战第10天】本文探讨了如何利用Python的Pandas库和前端框架Vue.js创建交互式数据可视化应用。通过Pandas进行数据处理和分析,Vue.js构建用户界面,结合两者可实现动态图表展示。步骤包括数据准备、转换为JSON、创建Vue项目、发送数据请求、渲染图表、添加交互性和优化性能。这种结合为数据理解和探索提供了高效、用户友好的解决方案,适应于数据爱好者和专家,预示着未来数据可视化将更智能、互动。
|
1月前
|
数据采集 Web App开发 数据可视化
Python爬虫技术与数据可视化:Numpy、pandas、Matplotlib的黄金组合
Python爬虫技术与数据可视化:Numpy、pandas、Matplotlib的黄金组合
|
1月前
|
数据可视化 数据挖掘 Python
Pandas 高级教程——数据可视化
Pandas 高级教程——数据可视化
104 3
|
11月前
|
数据可视化 索引 Python
Plotly 和 Pandas:强强联手实现有效的数据可视化
Plotly 和 Pandas:强强联手实现有效的数据可视化
61 0
|
10月前
|
数据可视化 数据处理 Python
Pandas+Pyecharts | 北京近五年历史天气数据可视化
Pandas+Pyecharts | 北京近五年历史天气数据可视化
|
10月前
|
数据可视化 数据挖掘 定位技术
Pandas+Pyecharts | 广州市已成交房源信息数据可视化
Pandas+Pyecharts | 广州市已成交房源信息数据可视化