往往写爬虫的时候,有些需求是需要直接将数据存入excel文档,或者读取出来并处理的,所以如何用python操作excel将会非常方便我们将数据可视化非常方便。
python首先安装openpyxl模块,据我来说,其它操作excel的模块没有openpyxl简洁。下面会体会到。
pip install openpyxl
写入数据
如果是要创建新的文档需要导入Workbook
from openpyxl import Workbook # 生成新的excel文档 workbook = Workbook() # 获取第一张工作表 sheet = workbook.active # # 添加一整行数据 sheet.append(['用户id','性别','昵称','市代码','省代码']) # 本地保存test.xlsx workbook.save("test.xlsx")
如果是要加载并追加已经存在的xlsx文档,就要导入load_workbook
from openpyxl import load_workbook # 加载已经存在的excel文档 workbook = load_workbook('test.xlsx') # 获取第一张工作表 sheet = workbook.active # 添加一整行数据 sheet.append(['用户id','性别','昵称','市代码','省代码']) # 保存 workbook.save()
加入数据话,一般采用的是一整行一整行的添加,非常方便高效
sheet.append(['用户id','性别','昵称','市代码','省代码']) sheet.append(['78459037','1','Roger卓','441200','440000'])
读取数据
读取的话,同样的先打开一个工作表
workbook = openpyxl.load_workbook("创新积分核心指标所需数据.xlsx") # 可以使用workbook对象的sheetnames属性获取到excel文件中哪些表有数据 table = workbook.active # 获取最大列数 rows = table.max_row # 获取最大行数 cols = table.max_col
如果要获取哪行哪列的数据,然后使用这个就行了
table.cell(4, 5).value
即获取第4行5列的数据