Python 读写 Excel 文件-阿里云开发者社区

Python 读写 Excel 文件

2024-04-18 186

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Python 读写 Excel 文件

在 Python 中，想去读写 Excel 文件的方式，有蛮多种方式的，比如说可以用 xlrd、openpyxl、pandas 等模块都能去实现，只是说在不同的模块上去读写稍有区别。

我自己喜欢使用 pandas，它足够强大。

01 Pandas 是什么？

Pandas 是一个开源的第三方 Python 库，基于 Numpy 和 Matplotlib 上构建而来，业内数据分析主流方向【三件套】（NumPy、Matplotlib、Pandas）。Pandas 已经成为 Python 数据分析的必备高级工具，它作为强大、灵活、可以支持任何编程语言的数据分析工具，颇受大家的喜爱。

02 安装 Pandas

第一种方式（推荐）：

打开终端，输入：pip install pandas命令即可安装。

第二种方式：

找到 Pandas 的下载库：https://www.lfd.uci.edu/~gohlke/pythonlibs/

然后下载自己想要的版本。

03 将数据写入 Excel 文件

Excel 就是一个表格，它里面有【行】和【列】，这是我们需要重点关注的两个地方，不管是读数据，还是写数据，其实就是在操作行和列。

非常简单的，咱们来实现一个简单的【用户表】，大致思路是这样的：

先导入 pandas 库
准备数据，并创建一个工作表
自定义索引（我故意加的）
将数据写到 excel 表格中（此处会自动创建 excel 文件）

具体代码如下：

# 第一步，导入 pandas 库，取个别名
import pandas as pd
# 第二步，准备数据，并创建一个工作表
# DataFrame 数据帧，重点概念
# 它相当于我们【工作簿】中的一个【工作表】
df = pd.DataFrame({
    'id':[1,2,3], 
    'name':['张三', '李四', '王五'],
    'age':[22, 33, 44]
})
# 第三步，Pandas 会使用默认的索引
# 但咱还是自定义索引吧，要不导致生成的工作表也会存在它默认的索引，不太好
df = df.set_index('id')
print(df)
# 第四步，将数据写入到 excel 文件中
df.to_excel('people.xlsx')
print('Done!')

04 从 Excel 中读取数据

有个前提，你得先有一份 excel 文件，千万不要太紧张给忘了。

就一个重点方法：read_excel()

你可以指定读哪个文件？读哪个工作表？从哪行开始读？……

咱们，还是看代码吧，非常简单：

# 参数1：指定读取 hello.xlsx 文件
# 参数2：header = 3 表示从第四行开始，因为索引是从 0 开始的
# 参数3：sheet_name 指定所要去读取的工作表
user= pd.read_excel('user.xlsx', header=3, sheet_name='sheet1')
# 输出列名
print(user.columns)
# 如果你的 Excel 中没有开头标题，可以用 header = None 来进行设置
user= pd.read_excel('user.xlsx', header=None)
user.columns = ['id', 'name', 'age']
print(user.columns)
# 通过 index_id 去指定 id 列作为索引
user = pd.read_excel('user.xlsx', index_col='id')
# head 默认指输出前 5 行，此时就不会产生默认索引了
print(user.head())
# skiprows 开头跳过几行
# usecols 使用那些列中的数据
# dtype 设置某一列的类型
users = pd.read_excel('user.xlsx', skiprows = 3, usecols='E:H', dytpe={'ID':str, 'gender':str, 'birthday':str})
# 如果你想按照某个列去排序，也是可以的
# 使用 sort_values 就可以实现了
# sort_values 指按值排序
# by 指针对某一行
# ascending 为 False 指表示从大到小
# inplace 指是否马上生效
users.sort_values(by='age', ascending=False, inplace=True)

Python 读写 Excel 文件

01 Pandas 是什么？

02 安装 Pandas

03 将数据写入 Excel 文件

04 从 Excel 中读取数据

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Python 读写 Excel 文件

01 Pandas 是什么？

02 安装 Pandas

03 将数据写入 Excel 文件

04 从 Excel 中读取数据

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像