一个Excel电子表格文档称为一个工作薄。
每个工作薄可以包含多个工作表。
用户当前查看的表,称为活动表。
python没有自带openpyxl,所以必须安装。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
c:\python\Scripts>pip3.6 install openpyxl
Collecting openpyxl
Downloading openpyxl-2.4.9.tar.gz (157kB)
100% |████████████████████████████████| 163kB 183kB/s
Collecting jdcal (from openpyxl)
Downloading jdcal-1.3.tar.gz
Collecting et_xmlfile (from openpyxl)
Downloading et_xmlfile-1.0.1.tar.gz
Installing collected packages: jdcal, et-xmlfile, openpyxl
Running setup.py install for jdcal ... done
Running setup.py install for et-xmlfile ... done
Running setup.py install for openpyxl ... done
Successfully installed et-xmlfile-1.0.1 jdcal-1.3 openpyxl-2.4.9
c:\python>python.exe
Python 3.6.1 (v3.6.1:69c0db5, Mar 21 2017, 18:41:36) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import openpyxl
>>>
|
用openpyxl模块打开Excel文档
1
2
3
4
|
>>>
import
openpyxl
>>> wb
=
openpyxl.load_workbook(
'example.xlsx'
)
>>>
type
(wb)
<
class
'openpyxl.workbook.workbook.Workbook'
>
|
openpyxl.load_workbook()函数接受文件名,返回一个workbook数据类型的值。这个workbook对象代表这个Excel文件。
example.xlsx需要在当前工作目录,才能处理它。可以导入os,使用函数os.getcwd()确定当前工作目录,并用os.chdir()改变当前工作目录。
从工作薄中取得工作表
调用get_sheet_names()方法可以取得工作薄中所有表名的列表。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
>>>
import
openpyxl
>>> wb
=
openpyxl.load_workbook(
'example.xlsx'
)
>>> wb.get_sheet_names()
[
'Sheet1'
,
'Sheet2'
,
'Sheet3'
]
>>> sheet
=
wb.get_sheet_by_name(
'Sheet3'
)
>>> sheet
<Worksheet
"Sheet3"
>
>>>
type
(sheet)
<
class
'openpyxl.worksheet.worksheet.Worksheet'
>
>>> sheet.title
'Sheet3'
>>> anotherSheet
=
wb.get_active_sheet()
>>> anotherSheet
<Worksheet
"Sheet3"
>
|
每个表由一个Worksheet对象表示,可以通过向工作薄方法get_sheet_by_name()传递表名字符串获得。
调用Workbook对象的get_active_sheet()方法,取得工作薄的活动表。
从表中取得单元格
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
>>>
import
openpyxl
>>> wb
=
openpyxl.load_workbook(
'example.xlsx'
)
>>> sheet
=
wb.get_sheet_by_name(
'Sheet1'
)
>>> sheet[
'A1'
]
<Cell
'Sheet1'
.A1>
>>> sheet[
'A1'
].value
=
'apple'
>>> sheet[
'A1'
].value
'apple'
>>> c
=
sheet[
'B1'
]
>>> c.value
=
'juice'
>>>
str
(c.row)
'1'
>>> c.row
1
>>> c.column
'B'
>>> c.coordinate
'B1'
|
Cell对象的value属性,包含这个单元格中保存的值。
Cell对象也有row、column和coordinate属性,提供该单元格的位置信息。
第一行或第一列的整数是1,不是0。
1
2
3
4
5
6
7
8
9
10
11
|
>>> sheet.cell(row
=
1
,column
=
2
)
<Cell
'Sheet1'
.B1>
>>> sheet.cell(row
=
1
,column
=
2
).value
'juice'
>>>
for
i
in
range
(
1
,
8
,
2
):
...
print
(i,sheet.cell(row
=
i,column
=
2
).value)
...
1
juice
3
None
5
None
7
None
|
可以通过Worksheet对象的get_highest_row()和get_highest_column()方法,确定表的大小。
get_highest_column()方法返回一个整数,而不是Excel中出现的字母。
列字母和数字之间的转换
要从字母转换到数字,就调用openpyxl.cell.column_index_from_string()函数。
要从数字转换到字母,就调用openpyxl.cell.get_column_letter()函数。
从表中取得行和列
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
>>>
import
openpyxl
>>> wb
=
openpyxl.load_workbook(
'example.xlsx'
)
>>> sheet
=
wb.get_sheet_by_name(
'Sheet1'
)
>>>
tuple
(sheet[
'A1'
:
'C3'
])
((<Cell
'Sheet1'
.A1>, <Cell
'Sheet1'
.B1>, <Cell
'Sheet1'
.C1>), (<Cell
'Sheet1'
.A2>, <Cell
'Sheet1'
.B2>, <Cell
'Sheet1'
.C2>), (<Cell
'Sheet1'
.A3>, <Cell
'Sheet1'
.B3>, <Cell
'Sheet1'
.C3>))
>>>
for
i
in
sheet[
'A1'
:
'C3'
]:
...
for
j
in
i:
...
print
(j.coordinate,j.value)
...
print
(
'--- END OF ROW ---'
)
...
A1 apple
B1 juice
C1 cake
-
-
-
END OF ROW
-
-
-
A2
None
B2 nurse
C2
None
-
-
-
END OF ROW
-
-
-
A3
None
B3
None
C3
None
-
-
-
END OF ROW
-
-
-
|
总结:
1、导入openpyxl模块
2、调用openpyxl.load_workbook()函数
3、取得Workbook对象
4、调用get_active_sheet()或get_sheet_by_name()工作薄方法
5、取得Worksheet对象
6、使用索引或工作表的cell()方法,带上row和column关键字参数
7、取得Cell对象
8、读取Cell对象的value属性
【扩展】
1、Font对象
Font对象的style属性影响文本在单元格中的显示方式。
要设置字体风格属性,就向Font()函数传入关键字参数。
2、公式
1
2
|
>>> sheet[
'B10'
]
=
'=sum(B1:B9)'
>>> wb.save(
'example.xlsx'
)
##保存
|
3、调整行和列
Worksheet对象由row_dimensions和column_dimensions属性,控制行高和列宽。
1
2
3
|
>>> sheet.row_dimensions[
1
].height
=
70
>>> sheet.column_dimensions[
'B'
].width
=
40
>>> wb.save(
'example.xlsx'
)
|
利用merge_cells()工作表方法,可以将一个矩形区域中的单元格合并为一个单元格。
要拆分单元格,就调用unmerge_cells()工作表方法。
1
2
|
>>> sheet.merge_cells(
'A1:D3'
)
>>> wb.save(
'example.xlsx'
)
|
在OpenPyXL中,每个Worksheet对象都有一个freeze_panes属性,可以设置为一个Cell对象或一个单元格坐标的字符串。
单元格上边的所有行和左边的所有列都会冻结,但单元格所在的行和列不会冻结。
要解冻所有的单元格,就将freeze_panes设置为None或‘A1’。
1
2
|
>>> sheet.freeze_panes
=
'A2'
##行1将永远可见
>>> wb.save(
'example.xlsx'
)
|
如果需要创建图标,需要做下列事情:
1、从一个矩形区域选择的单元格,创建一个Reference对象
2、通过传入Reference对象,创建一个Series对象
3、创建一个Chart对象
4、将Series对象添加到Chart对象
5、可选地设置Chart对象的drawing.top、drawing.left、drawing.width和drawing.height变量
6、将Chart对象添加到Worksheet对象
如果加载一个Workbook对象,然后马上保存到同样的.xlsx文件名中,实际上会删除其中的图表。