你要的Python可视化工具都在这里

简介:

声明:本文是对这篇文章的总结,所有的例子都在本地实际运行过,并修复了原文中一些在python 3下运行时的bug。

本人微博:珞珈学渣,本人博客:博客原文
简介
python的第三方包有多个选项来可视化数据,这给了我们更多的选择空间,但也正是由于这种多样性,确定使用哪一个可视化工具来完成任务时有挑战性。本文包含一些更受欢迎的示例,并说明如何使用它们来创建一个简单的条形图。本文使用到的数据,可以通过这个链接下载。我将分别使用下边的工具创建统计图形:

  1. Pandas
  2. Seaborn
  3. ggplot
  4. Bokeh
  5. pygal
  6. Plotly

Matplotlib的讨论
Matplotlib是python可视化包的祖父,它是非常强大的,你通常可以使用matplotlib做出任何你想要的统计图形,这在前一篇文章中已经有描述,但是使用起来也最为复杂。本文不打算给出纯Matplotlib例子,因为许多工具(特别是Pandas和Seaborn)在matplotlib上进行了一些封装,使得matplotlib使用起来更为简单明了。
一点经验
统计制图过程中所面临的最大的挑战是给定一些大的标签,格式化x和y轴,使数据看起来合理,另外也需要花一些时间将数据格式化为每个工具想要的格式。
Pandas
我使用一个pandas DataFrame作为所有各种绘图的起点。幸运的是,pandas确实为我们提供了一个内置的绘图能力,这是matplotlib的一个层。
首先,import我们的模块,并读入数据到一个budget的DataFrame,然后对数据进行排序,并选取前10行。

import pandas as pd
budget = pd.read_csv("mn-budget-detail-2014.csv")
budget = budget.sort('amount',ascending=False)[:10]
budget
                                      category                                         detail     amount
46                              ADMINISTRATION   Capitol Renovation and Restoration Continued  126300000
1                      UNIVERSITY OF MINNESOTA        Minneapolis; Tate Laboratory Renovation   56700000
78                              HUMAN SERVICES        Minnesota Security Hospital - St. Peter   56317000
0                      UNIVERSITY OF MINNESOTA  Higher Education Asset Preservation (HEAPR) 1   42500000
5    MINNESOTA STATE COLLEGES AND UNIVERSITIES  Higher Education Asset Preservation (HEAPR) 2   42500000
6    MINNESOTA STATE COLLEGES AND UNIVERSITIES                  Metropolitan State University   35865000
13   MINNESOTA STATE COLLEGES AND UNIVERSITIES           Minnesota State University - Mankato   25818000
59                              TRANSPORTATION             Local Road Improvement Fund Grants   24356000
105        EMPLOYMENT AND ECONOMIC DEVELOPMENT                    Minneapolis - Nicollet Mall   21500000
121           MINNESOTA HOUSING FINANCE AGENCY                      MN Housing Finance Agency   20000000

现在,设置pandas的显示以使用更好的默认值,并创建条形图:

pd.options.display.mpl_style = 'default'
budget_plot = budget.plot(kind="bar",x=budget["detail"], title="MN Capital Budget - 2014",legend=False)

得到的图形如下:


可以通过下面的代码将图像保存为png文件。

fig = budget_plot.get_figure()
fig.savefig("2014-mn-capital-budget.png")

Seaborn
Seaborn是一个基于matplotlib的可视化库,它试图使默认数据可视化在视觉上更吸引人,另外它和pandas能够很好的集成,使更复杂的统计图形更加容易的被创建。
首先载入数据到pandas:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
 
budget = pd.read_csv("mn-budget-detail-2014.csv")
budget = budget.sort('amount',ascending=False)[:10]

然后使用seaborn进行统计制图:

sns.set_style("darkgrid")
bar_plot = sns.barplot(x=budget["detail"],y=budget["amount"], palette="muted",x_order=budget["detail"].tolist())
plt.xticks(rotation=90)
plt.show()

得到统计图形如下


需要注意的是在上面的代码里使用了matplotlib对X轴的标签进行了垂直化处理,从而使得它们不会重叠在一起。

ggplot
ggplot类似于Seaborn,它建立在matplotlib之上,旨在以一种简单的方式提高matplotlib可视化的视觉吸引力。它和seaborn不同之处在于它是一个R统计图形包ggplot2移植到python的版本.所以一些API看起来不是那么符合python的规范,但是它的功能非常强大。
继续导入并读取我们的数据:


import pandas as pd
from ggplot import *
 
budget = pd.read_csv("mn-budget-detail-2014.csv")
budget = budget.sort('amount',ascending=False)[:10]
然后使用ggplot命令创建统计图形


p = ggplot(budget, aes(x="detail",y="amount")) + \
    geom_bar(stat="bar", labels=budget["detail"].tolist()) +\
    ggtitle("MN Capital Budget - 2014") + \
    xlab("Spending Detail") +  \
    ylab("Amount") + scale_y_continuous(labels='millions') + \
    theme(axis_text_x=element_text(angle=90))
print(p)

得到的统计图形如下

然后可以使用下面的命令将图形存储为png文件。

ggsave(p, "mn-budget-capital-ggplot.png")

   Bokeh
Bokeh不同于之前的3个库,因为它不依赖于matplotlib并且适合于在现代web浏览器中生成可视化。
首先载入数据到pandas:


import pandas as pd
from bokeh.charts import Bar, show
 
budget = pd.read_csv("mn-budget-detail-2014.csv")
budget = budget.sort('amount',ascending=False)[:10]
details = budget["detail"].values.tolist()
amount = list(budget["amount"].astype(float).values)
bar = Bar(budget, 'detail', values='amount', title="MN Capital Budget - 2014", )
show(bar)
运行上面的命令浏览器会自动被打开,并得到统计图形如下:


Pygal
Pygal用于创建svg图表,svg文件对于制作交互式图表非常有用, 使用此工具创建独特的外观和视觉吸引力的图表是很容易的。


import pandas as pd
import pygal
from pygal.style import LightStyle
 
budget = pd.read_csv("mn-budget-detail-2014.csv")
budget = budget.sort('amount',ascending=False)[:10]
bar_chart = pygal.Bar(style=LightStyle, width=800, height=600, legend_at_bottom=True, human_readable=True, title='MN Capital Budget - 2014')
for index, row in budget.iterrows():
    bar_chart.add(row["detail"], row["amount"])
bar_chart.render_to_file('budget.svg')
得到统计图形如下:



Plot.ly
Plot.ly是一个用于做分析和可视化的在线工具,Plotly与pandas可以无缝地集成,可以做出很多非常丰富,互动的图表,并且文档非常健全,创建条形图相对简单,另外申请了API密钥后,可以一键将统计图形同步到云端。


import plotly.plotly as py
import pandas as pd
from plotly.graph_objs import *
from plotly.offline import plot
 
budget=pd.read_csv("mn-budget-detail-2014.csv")
budget = budget.sort('amount',ascending=False)[:10]
data = Data([
    Bar(
        x=budget["detail"],
        y=budget["amount"]
    )
])
layout = Layout(
    title='2014 MN Capital Budget',
    font=Font(
        family='Raleway, sans-serif'
    ),
    showlegend=False,
    xaxis=XAxis(
        tickangle=-45
    ),
    bargap=0.05
)
fig = Figure(data=data, layout=layout)

运行上面的命令浏览器会自动打开,并得到统计图形如下:


做出的统计图形很漂亮,交互程度很高,还可以一键同步到云端,或者分享给别人。


在python生态系统中绘制数据是一个好消息/坏消息。好消息是,有很多选择,坏消息是,有很多选择, 试图找出哪些适用于你将取决于你想要完成什么。
这里是我的一些想法:
a.Pandas是方便的简单的地块,但你需要愿意学习matplotlib自定义。
b.Seaborn可以支持一些更复杂的可视化方法,但仍然需要matplotlib知识来调整。
c.ggplot还不太稳定,在迅速发张中。
d.bokeh是一个强大的工具,如果你想设置自己的可视化服务器。
e.pygal独自通过能够生成交互式svg图形和png文件,单它不像基于matplotlib的解决方案那么灵活。
f.Plotly生成最互动的图表,您可以离线保存它们,并创建非常丰富的基于Web的可视化。

相关文章
|
1月前
|
JavaScript 前端开发 Android开发
【03】仿站技术之python技术,看完学会再也不用去购买收费工具了-修改整体页面做好安卓下载发给客户-并且开始提交网站公安备案-作为APP下载落地页文娱产品一定要备案-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
【03】仿站技术之python技术,看完学会再也不用去购买收费工具了-修改整体页面做好安卓下载发给客户-并且开始提交网站公安备案-作为APP下载落地页文娱产品一定要备案-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
76 13
【03】仿站技术之python技术,看完学会再也不用去购买收费工具了-修改整体页面做好安卓下载发给客户-并且开始提交网站公安备案-作为APP下载落地页文娱产品一定要备案-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
|
2月前
|
测试技术 数据库 Python
Python装饰器实战:打造高效性能计时工具
在数据分析中,处理大规模数据时,分析代码性能至关重要。本文介绍如何使用Python装饰器实现性能计时工具,在不改变现有代码的基础上,方便快速地测试函数执行时间。该方法具有侵入性小、复用性强、灵活度高等优点,有助于快速发现性能瓶颈并优化代码。通过设置循环次数参数,可以更准确地评估函数的平均执行时间,提升开发效率。
122 61
Python装饰器实战:打造高效性能计时工具
|
1月前
|
JavaScript 搜索推荐 Android开发
【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
68 8
【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
|
1月前
|
数据采集 JavaScript Android开发
【02】仿站技术之python技术,看完学会再也不用去购买收费工具了-本次找了小影-感觉页面很好看-本次是爬取vue需要用到Puppeteer库用node.js扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
【02】仿站技术之python技术,看完学会再也不用去购买收费工具了-本次找了小影-感觉页面很好看-本次是爬取vue需要用到Puppeteer库用node.js扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
57 7
【02】仿站技术之python技术,看完学会再也不用去购买收费工具了-本次找了小影-感觉页面很好看-本次是爬取vue需要用到Puppeteer库用node.js扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
|
2月前
|
数据可视化 算法 数据挖掘
Python时间序列分析工具Aeon使用指南
**Aeon** 是一个遵循 scikit-learn API 风格的开源 Python 库,专注于时间序列处理。它提供了分类、回归、聚类、预测建模和数据预处理等功能模块,支持多种算法和自定义距离度量。Aeon 活跃开发并持续更新至2024年,与 pandas 1.4.0 版本兼容,内置可视化工具,适合数据探索和基础分析任务。尽管在高级功能和性能优化方面有提升空间,但其简洁的 API 和完整的基础功能使其成为时间序列分析的有效工具。
96 37
Python时间序列分析工具Aeon使用指南
|
2月前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
3月前
|
数据可视化 编译器 Python
Manim:数学可视化的强大工具 | python小知识
Manim(Manim Community Edition)是由3Blue1Brown的Grant Sanderson开发的数学动画引擎,专为数学和科学可视化设计。它结合了Python的灵活性与LaTeX的精确性,支持多领域的内容展示,能生成清晰、精确的数学动画,广泛应用于教育视频制作。安装简单,入门容易,适合教育工作者和编程爱好者使用。
804 7
|
4月前
|
存储 数据可视化 数据挖掘
使用Python进行数据分析和可视化
本文将引导你理解如何使用Python进行数据分析和可视化。我们将从基础的数据结构开始,逐步深入到数据处理和分析的方法,最后通过实际的代码示例来展示如何创建直观的数据可视化。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的见解和技巧。让我们一起探索数据的世界,发现隐藏在数字背后的故事!
170 5
|
4月前
|
JavaScript 前端开发 开发者
探索 DrissionPage: 强大的Python网页自动化工具
DrissionPage 是一个基于 Python 的网页自动化工具,结合了浏览器自动化的便利性和 requests 库的高效率。它提供三种页面对象:ChromiumPage、WebPage 和 SessionPage,分别适用于不同的使用场景,帮助开发者高效完成网页自动化任务。
402 4
|
4月前
|
开发者 Python
探索Python中的列表推导式:简洁而强大的工具
【10月更文挑战第41天】 在编程的世界中,效率与简洁是永恒的追求。本文将深入探讨Python编程语言中一个独特且强大的特性——列表推导式(List Comprehension)。我们将通过实际代码示例,展示如何利用这一工具简化代码、提升性能,并解决常见编程问题。无论你是初学者还是资深开发者,掌握列表推导式都将使你的Python之旅更加顺畅。

热门文章

最新文章