1、Numpy
NumPy是Python中科学计算%的基础包。它是一个Python库,提供多维数组%对象,各种派生对象,以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数,基本统计运算和随机模拟等等。
NumPv包的核心是 ndarray 对象。它封装了python原生的同数据类型的 n 维组,为了保证其性能优良,其中有许多操作都是代码在本地进行编译后执行的
NumPv的主要对象是同构多维数组Q。它是一个元素表,所有类型都相同,由非负整数%元组索引。在NumPv维度中称为轴.
2、Pandas
官网pypandas.cn/
Pandas 是 Python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,冒在简单、直观地处理关系型、标记型数据,广泛应用于数据分析9领域,Pandas 适用于处理与 Excel 表类似的表格数据,以及有序和无序的时间序列数据Q等
Pandas 的主要数据结构是Series (一维数据)和 DataFrame (二维数据),这两种数据结构足以处理金融、统计、社会科学Q,工程等领域里的大多数典型用例,使用pandas进行数据分析流程包含数据整理与清洗、数据分析与建模、数据可视化与制表等阶段
(group by)数据分组9、合、转换数据灵活的分组功能
(merge) 数据连接Q直观地合并功能
(reshape)数据重塑灵活地重塑功能:
3、Matplotlib
Matplotlib是一个Python 2D绘图库,它以多种硬拷贝格式和跨平台的交互式环境生成出版物质量的图形。Matplotlib可用于Python脚本,Python和IPython Shell、Jupyter笔记本,Web应用程序服务器Q和四个图形用户界面工具包。
Matplotlib 尝试使容易的事情变得更容易,使困难的事情变得可能,只需几行代码就可以生成图表、直方图9、功率谱、条形图、误差图、散点图·等.
为了简单绘图,该 pyplot 模块提供了类似于MATLAB的界面,尤其是与IPython结合使用时,对于高级用户,您可以通过面向对象的界面或MATLAB用户熟悉的一组功能来完全控制线型,字体屋性,轴屋性等
4、Seaborn
Seaborn 是一个基于matplotlib的 Python 数据可视化库,它建立在matplotlib之上,并与Pandas数据结构紧密集成,用于绘制有吸引力和信息丰富的统计图形%的高级界面。
Seaborn 可用于探索数据,它的绘图功能对包含整个数据集%的数据框和数组进行操作,并在内部执行必要的语义映射9和统计聚合以生成信息图,其面向数据集的声明式 API可以专注于绘图的不同元素的含义,而不是如何绘制它们的细节
Matplotlib 拥有全面而强大的 API,几乎可以根据自己的喜好更改图形的任何性,seaborn 的高级界面和 matplotlib 的深度可定制性相结合,使得Seaborn既可以快速探索数据,又可以创建可定制为出版质量最终产品%的图形。
5、Pyecharts
Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了
Pyecharts具有简洁的API 设计,使用如丝滑般流畅,支持链式调用,嘉括了30+ 种常见图表,应有尽有,支持主流Notebook 环境,Jupyter Notebook 和JupyterLab,拥有高度灵活的配置项,可轻松搭配出精美的图表。
Pyecharts强大的数据交互%功能,使数据表达信息更加生动,增加了人机互动效果,并目数据呈现效果可直接导出为html文件,增加数据结果交互的机会,使得信息沟通更加容易