PyHubWeekly | 第十八期:1行代码搞定数据可视化

简介: PyHubWeekly每周定期更新,精选GitHub上优质的Python项目/小工具。我把PyHubWeekly托管到了Github,感兴趣的可以搜索Github项目PyHubWeekly[1],如果喜欢,麻烦给个Star支持一下吧。此外,欢迎大家通过提交issue来投稿和推荐自己的项目~本期为大家推荐GitHub上5个优质的Python项目,它们分别是:•FlashText•PyFlux•bamboolib•MrDoc•AutoViz

下面分别来介绍一下上述5个GitHub项目。

FlashText

Start:4.3k

FlashText[2]是一款用于提取或者替换句子中关键字的工具。


FlashText具有诸多适合于网页爬虫或者文本处理的功能,例如,

提取替换删除多关键字...

有同学会有疑问,它和正则表达式功能大同小异,为什么要选择FlashText呢?


下面来通过一幅图对比一下两款工具在速度方面的表现,

19.png

安装使用

可以直接使用pip命令进行安装,

pip install flashtext

可以通过一个简单的示例看一下FlashText的使用,

>>> from flashtext import KeywordProcessor
>>> keyword_processor = KeywordProcessor()
>>> # keyword_processor.add_keyword(<unclean name>, <standardised name>)
>>> keyword_processor.add_keyword('Big Apple', 'New York')
>>> keyword_processor.add_keyword('Bay Area')
>>> keywords_found = keyword_processor.extract_keywords('I love Big Apple and Bay Area.')
>>> keywords_found
>>> # ['New York', 'Bay Area']


PyFlux

Start:1.7k


PyFlux[3]是一款开源的时间序列分析库。


时序分析是统计学中非常重要的一个分支,在具有时序特征的数据中,往往蕴含着很多令人感兴趣的特征信息,可以根据这些信息对未来进行准确的预测。


PyFlux将推理模型(frequentist和Bayesian)和参数设置应用于时序分析中,使得时序分析变得更加容易。PyFlux具备如下特性,


为时间序列数据建立模型

对模型进行推理模型的检查和评估

模型修改用模型进行回顾和预测


具体的示例,可以查看官方文档[4]


bamboolib

Start:550


bamboolib[5]是使得pandas DataFrames数据分析变得更加容易的一款Python库。


做数据相关工作的同学,对pandas肯定不会陌生。它很强大,甚至对于很多Python开发者具备着不可替代的位置,但是对于初学者却有时候让人难以理解。


bamboolib使得pandas DataFrames数据分析变得更加简单容易,在以往需要上百行完成的工作,在bamboolib中只需要简短的一行即可。


通过bamboolib的使用,它可以提升你的工作效率,减少在无价值的事情上浪费过多精力。

20.png

另外,bamboolib不仅支持本地使用,还可以在jupyter notebook和jupyterLab中使用。


安装

下面分别是本地、jupyter notebook、jupyterLab中安装的方法,

pip install bamboolib
# Jupyter Notebook extensions
python -m bamboolib install_nbextensions
# JupyterLab extensions
python -m bamboolib install_labextensions

                               MrDoc

Start:167


MrDoc[6]基于Python开发的在线文档系统,适合作为个人和小型团队的文档、笔记、知识管理工具。

21.png


MrDoc可以支持markdown、表格、图片上传等文档常用的功能,另外,它还具备一个完善系统应当具备的用户注册、管理等功能。可以用于团队内部的知识共享,文档管理。


另外,MrDoc已经开源,作为一个完善的应用系统,对于Python感兴趣的同学也可以拿这个项目用于学习和提升,了解一个完善系统的开发需要哪些环节,包含哪些模块,整个链路又是如何衔接的。


AutoViz

Start:140

AutoViz[7]是一款数据集可视化工具。

通过AutoViz,一行代码就可以轻松实现数据集的可视化工作。

22.png


AutoViz除了在数据可视化方面做了很多优化之外,还在数据源接口方面提供了很大的便利。它可以同时兼容txt、json、csv等离线数据格式。


安装使用

通过pip安装AutoViz,

pip install autoviz


使用AutoViz过程中,首先需要对AutoViz进行实例化,

from autoviz.AutoViz_Class import AutoViz_Class
AV = AutoViz_Class()


然后加载数据,在家在数据过程中,可以把数据加载进pandas DataFrame,也可以简单的提供一个数据路径。剩余的工作,交给AutoViz即可,

filename = ""
sep = ","
dft = AV.AutoViz(
    filename,
    sep,
    target,
    df,
    header=0,
    verbose=0,
    lowess=False,
    chart_format="svg",
    max_rows_analyzed=150000,
    max_cols_analyzed=30,
)
相关文章
|
9月前
|
数据采集 数据可视化 搜索推荐
《统计学简易速速上手小册》第2章:数据探索与可视化(2024 最新版)
《统计学简易速速上手小册》第2章:数据探索与可视化(2024 最新版)
79 1
|
监控 数据可视化 安全
如何使用webgl(three.js)实现煤矿隧道、井下人员定位、掘进面、纵采面可视化解决方案——第十九课(一)
three.js、webgl、3D煤矿隧道、三维井下人员定位、掘进面三维可视化、纵采面可视化、采集面可视化展示、设备检测、数字孪生、物联网3D、3d建筑、3d库房,bim管理系统
369 1
|
5月前
|
数据可视化 数据挖掘 Linux
震撼发布!Python数据分析师必学,Matplotlib与Seaborn数据可视化实战全攻略!
在数据科学领域,数据可视化是连接数据与洞察的桥梁,能让复杂的关系变得直观。本文通过实战案例,介绍Python数据分析师必备的Matplotlib与Seaborn两大可视化工具。首先,通过Matplotlib绘制基本折线图;接着,使用Seaborn绘制统计分布图;最后,结合两者在同一图表中展示数据分布与趋势,帮助你提升数据可视化技能,更好地讲述数据故事。
93 1
|
5月前
|
数据可视化 数据挖掘 Python
惊呆了!Python数据分析师如何用Matplotlib、Seaborn秒变数据可视化大师?
在数据驱动时代,分析师们像侦探一样在数字海洋中寻找线索,揭示隐藏的故事。数据可视化则是他们的“魔法棒”,将复杂数据转化为直观图形。本文将带你探索Python数据分析师如何利用Matplotlib与Seaborn这两大神器,成为数据可视化大师。Matplotlib提供基础绘图功能,而Seaborn在此基础上增强了统计图表的绘制能力,两者结合使数据呈现更高效、美观。无论是折线图还是箱形图,这两个库都能助你一臂之力。
60 4
|
6月前
|
数据可视化 定位技术 Python
在模仿中精进数据可视化03:OD数据的特殊可视化方式
在模仿中精进数据可视化03:OD数据的特殊可视化方式
94 2
|
6月前
|
数据可视化
说出来你可能不信,自从有了他,分分钟上手数据可视化
说出来你可能不信,自从有了他,分分钟上手数据可视化
说出来你可能不信,自从有了他,分分钟上手数据可视化
|
6月前
|
数据可视化 数据挖掘 开发者
揭秘数据可视化的魔法:如何用Python的Matplotlib库将枯燥数字变成引人入胜的故事,轻松俘获观众的心!
【8月更文挑战第12天】在数据科学中,将复杂数据转化为直观图形至关重要。Python凭借其强大的库支持,在数据可视化方面表现卓越,其中Matplotlib更是佼佼者。它功能全面且易于使用,已成为Python数据可视化的标配。通过简单命令即可安装Matplotlib。示例中,我们展示了如何绘制基本线图、散点图及多数据集对比图,并介绍了如何添加标题、标签和图例等元素。Matplotlib还支持丰富的图表定制选项,如颜色、线型等,帮助用户创建专业级图表。无论是数据分析还是结果展示,掌握Matplotlib都能显著提升数据表达能力。
27 1
|
7月前
|
数据可视化 数据挖掘 Python
|
数据可视化 Python
《Python编程:从入门到实践》学习记录(15)项目-数据可视化 matplotlib, pygal
《Python编程:从入门到实践》学习记录(15)项目-数据可视化 matplotlib, pygal
《Python编程:从入门到实践》学习记录(15)项目-数据可视化 matplotlib, pygal
|
数据采集 Web App开发 数据可视化
Python实战 | 送亲戚,送长辈,“ 月饼 ”可视化大屏来帮忙!
Python实战 | 送亲戚,送长辈,“ 月饼 ”可视化大屏来帮忙!
Python实战 | 送亲戚,送长辈,“ 月饼 ”可视化大屏来帮忙!

热门文章

最新文章