Python数据分析:pandas玩转Excel(一)

简介: Python数据分析:pandas玩转Excel(一)

1 pandas简介


1.Pandas是什么?


Pandas是一个强大的分析结构化数据的工具集;


它的使用基础是Numpy(提供高性能的矩阵运算);


用于数据挖掘和数据分析,同时也提供数据清洗功能。

2.DataFrame


DataFrame是Pandas中的一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。


pandas 相当于 python 中 excel:它使用表(也就是 dataframe),能在数据上做各种变换,但还有其他很多功能。


class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)


image.png


3.Series


它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。


4.pandas 网址


官网:https://pandas.pydata.org/


中文网:https://www.pypandas.cn/


2 导入


image.png


还需要执行以下导入才能开始:


import pandas as pd
import numpy as np


3 使用

# 使用Pandas
>>> import pandas as pd
>>> df = pd.DataFrame() 
>>> print(df)
# 输出结果
Empty DataFrame
Columns: []
Index: []

4 读取、写入

import pandas as pd
df = pd.read_excel("D:/项目/资料/People.xlsx")     # 把文件读到内存中形成DataFrame
print(df.shape)     # 读取文件行数和列数
print(df.columns)   # 读取列名
print(df.head(3))   # 打印前3行
print(df.tail(3))   # 打印后3行
df = pd.DataFrame({"ID":[1,2,3],"Name":["jack","小明","小红"]})
df = df.set_index("ID")     # 把ID那一列当索引,并产生新的DataFrame
df.to_excel("D:/项目/我爱你.xlsx")   # 写入文件
print("Done!")
目录
相关文章
|
18天前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
|
24天前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
72 4
数据分析的 10 个最佳 Python 库
|
17天前
|
数据可视化 数据处理 Python
使用Pandas实现Excel中的数据透视表功能
本文介绍了如何使用Python的Pandas库实现Excel中的数据透视表功能,包括环境准备、创建模拟销售数据、代码实现及输出等步骤。通过具体示例展示了按地区和销售员汇总销售额的不同方法,如求和、平均值、最大值等,帮助读者掌握Pandas在数据处理上的强大能力。
52 12
|
16天前
|
数据采集 分布式计算 大数据
构建高效的数据管道:使用Python进行ETL任务
在数据驱动的世界中,高效地处理和移动数据是至关重要的。本文将引导你通过一个实际的Python ETL(提取、转换、加载)项目,从概念到实现。我们将探索如何设计一个灵活且可扩展的数据管道,确保数据的准确性和完整性。无论你是数据工程师、分析师还是任何对数据处理感兴趣的人,这篇文章都将成为你工具箱中的宝贵资源。
|
29天前
|
传感器 物联网 开发者
使用Python读取串行设备的温度数据
本文介绍了如何使用Python通过串行接口(如UART、RS-232或RS-485)读取温度传感器的数据。详细步骤包括硬件连接、安装`pyserial`库、配置串行端口、发送请求及解析响应等。适合嵌入式系统和物联网应用开发者参考。
45 3
|
1月前
|
数据采集 数据可视化 数据处理
Python数据科学:Pandas库入门与实践
Python数据科学:Pandas库入门与实践
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据科学实战:从Pandas到机器学习
Python数据科学实战:从Pandas到机器学习
|
1月前
|
图形学 Python
SciPy 空间数据2
凸包(Convex Hull)是计算几何中的概念,指包含给定点集的所有凸集的交集。可以通过 `ConvexHull()` 方法创建凸包。示例代码展示了如何使用 `scipy` 库和 `matplotlib` 绘制给定点集的凸包。
28 1
|
29天前
|
数据采集 JavaScript 程序员
探索CSDN博客数据:使用Python爬虫技术
本文介绍了如何利用Python的requests和pyquery库爬取CSDN博客数据,包括环境准备、代码解析及注意事项,适合初学者学习。
76 0
|
1月前
|
数据采集 存储 分布式计算
超酷炫Python技术:交通数据的多维度分析
超酷炫Python技术:交通数据的多维度分析
下一篇
DataWorks