大家不论在日常工作还是生活中,都经常用到Excel这款办公软件,它在数据处理、报表生成等方面起到了重要作用。
然而,作为一个Python工程师,你可知道Python也能成为操作Excel的得力助手吗?而且Python有很多库可以作为Excel操作的利器。
Python可操作Excel的三方库有:
- Openpyxl
- Pandas
- Xlrd
- Xlwt
- Xlsxwriter
- Xlwings
- Xlutils
- Marmir
今天给大家介绍下 Openpyxl
库的使用,其他三方库会在后续文章中会续写介绍。
介绍
openpyxl
是一款用于读取和写入Excel的第三方Python库,支持xlsx格式。但是也有一个缺点,就是不支持xls格式文件的读取。
如果在实际使用过程中遇到了xls格式的文件需要使用Python进行处理,小编建议使用 pandas、xlrd、xlwt
等库。
安装
在使用Python操作Excel之前,我们需要先安装库:openpyxl。
通过以下命令可以快速安装:
pip install openpyxl
使用
Excel操作主要就是读取和写入,其他的就是单元格、样式设置、数据处理。
创建工作簿
我们需要引入 Workbook
这个类,创建工作簿:
from openpyxl import Workbook wb = Workbook()
一个工作簿(workbook)在创建的同时也会新建一张工作表(worksheet)。我们可以通过Workbook.active
得到正在运行的工作表:
ws = wb.active
注意:该函数调用工作表的索引(_active_sheet_index),默认是0。除非你修改了这个值,否则你使用该函数一直是在对第一张工作表进行操作。
使用Workbook.create_sheet()
新建一张sheet表:
ws1 = wb.create_sheet() #默认插在工作簿末尾 # 或者 ws2 = wb.create_sheet(0) # 插入在工作簿的第一个位置
在创建工作表的时候系统自动命名。他们按照序列依次命名 (Sheet, Sheet1, Sheet2, ...)。你可以通过调用下面的属性修改工作表的名称:
ws.title = "demo_title"
标签栏的背景色默认为白色,我们可以通过提供一个RGB颜色码改变标签栏的字体颜色:
ws.sheet_properties.tabColor = "1395FA"
获取工作簿的所有工作表:
print(wb.get_sheet_names()) # ['demo_title', 'Sheet1']
操作数据
通过上面的方法,我们已经学习到了如何获取工作表了,接下来基于工作表对象操作单元格中的内容。
使用单个单元格
单元格可以直接根据行列索引直接获取
a = ws['A1']
对单元格赋值
ws['A1'] = 3
当然,还可以获取单元格的值
a = ws.cell('A1')
或者
a = ws.cell(row=1, column=1)
注意:当一个工作表被创建时,其中不包含单元格。只有当单元格被获取时才会被创建。不会创建我们从不会使用的单元格,从而减少了内存消耗。
使用多个单元格
使用切片方式获取多个单元格
cells = ws['A1':'C2']
使用类方法获取多个单元格
print(tuple(ws.iter_rows('A1:C2'))) #((<Cell Sheet1.A1>, <Cell Sheet1.B1>, <Cell Sheet1.C1>), # (<Cell Sheet1.A2>, <Cell Sheet1.B2>, <Cell Sheet1.C2>)) for row in ws.iter_rows('A1:C2'): for cell in row: print cell #<Cell Sheet1.A1> #<Cell Sheet1.B1> #<Cell Sheet1.C1> #<Cell Sheet1.A2> #<Cell Sheet1.B2> #<Cell Sheet1.C2>
迭代文件中所有的行或者列
ws.rows #((<Cell Sheet.A1>, <Cell Sheet.B1>, <Cell Sheet.C1>), #(<Cell Sheet.A2>, <Cell Sheet.B2>, <Cell Sheet.C2>), #(<Cell Sheet.A3>, <Cell Sheet.B3>, <Cell Sheet.C3>)) # 或者 ws.columns #((<Cell Sheet.A1>, #<Cell Sheet.A2>, #...
数据存储
为单元格赋值(前提创建了单元格对象Cell)
c.value = '你好' d.value = 'OK'
保存到文件
wb = Workbook() wb.save('demo.xlsx')
注意:这个操作将会在没有认识提示的情况下用现在写的内容,覆盖掉原文件中的所有内容
读取文件
读取文件就很简单了,一行代码解决,得到一个wb对象,其他的操作都一样
from openpyxl import load_workbook wb = load_workbook('demo.xlsx') print(wb.get_sheet_names()) ['demo_title', 'Sheet1']
总结
使用openpyxl进行工作的时候,这个保存唯一需要注意的是:文件是默认替换的。也就是说我们在保存文件的时候,openpyxl将进行替换而不发出告警。如果大家想保存不同阶段的文件,则可以在保存文件的时候加一个时间戳。
Python操作Excel的这些基本步骤只是冰山一角,实际上,我们还可以进行更多更复杂的数据处理操作,如表格合并、公式计算等。Python在处理Excel方面的灵活性和扩展性让我们能够以更高效的方式完成工作。
让我们抛开繁琐的手动操作,让Python成为我们工作中的好帮手吧!相信通过本文的介绍,你已经明白了如何使用Python库进行Excel文件的读取、数据处理和导出。试着在实际工作中应用Python来解放自己吧!