编程小白的自学笔记十五(python办公自动化操作EXCEL表格)

简介: 编程小白的自学笔记十五(python办公自动化操作EXCEL表格)

前言

在自学笔记一的时候就已经学习了表格的操作,不过那时学的是xlwt库,这次我们学习的是openpyxl库。


一、xlwt库与openpyxl库的区别

xlwt和openpyxl都是Python中处理Excel文件的库,但它们有一些区别。其中,xlwt针对Ecxec2007之前的版本,即.xls文件,其要求单个sheet不超过65535行;而openpyxl则主要针对Excel2007之后的版本(.xlsx),它对文件大小没有限制 。

此外,两者还有一些其他的区别,例如:

xlwt单个表格只能存储65000多行,而openpyxl单个sheet可以存储101万行;

xlwt的文件名后缀为xls;而openpyxl的文件名后缀为xlsx;

xlwt写入数据时从0行0列开始;openpyxl从1行1列开始。

二、创建表格

1、导入模块

首先,使用import导入openpyxl库,以便能够使用其中的类和函数。

2、创建文件

使用openpyxl库里面的Workbook()函数创建一个新的excel文件。

3、保存并命名文件

使用save方法保存文件,并将文件名作为传参传进去。

完整代码如下:

import openpyxl
wb=openpyxl.Workbook()
wb.save('测试0709.xlsx')

这时我们就在python文件的同目录下创建了“测试0709”的excel文件。

三、打开表格

打开表格使用load_workbook()函数就行,具体代码如下:

wb=openpyxl.load_workbook(测试0709.xlsx)

四、输入内容

1、选取工作表

使用过excel的都知道,一般创建好表格文件以后,里面会有三个工作表,默认使用的是第一个工作表,即sheet1,但是我试了一下,用openpyxl创建的工作表只有一个sheet,我们可以使用workbook.active来选取它,workbook.active的意思是选取当前活跃工作表。我们也可以直接传参来指定工作表,例如:

import openpyxl
wb=openpyxl.Workbook()
ws=wb[‘sheet’]

通过传入工作表的名字来选择工作表。

2、在工作表中输入数据

最简单的方法就是直接输入,就好像我们正常人操作excel表格,比如我们要在A1输入‘序号’,B2输入‘数值’,那么我们就直接写

ws[A1]=序号

Ws[B1]=数值

也可以先定位,再使用value赋值,例如:

ws.cell(row=1,column=3,value='备注')

基于以上的方法,我们准备多录入点数据,以备后面的其他测试,代码如下:

import random
import openpyxl
wb=openpyxl.load_workbook('测试0709.xlsx')
ws=wb.active
ws['A1']='序号'
ws['B1']='数值'
ws.cell(row=1,column=3,value='备注')
for i in range(2,100):
    ws.cell(row=i,column=1,value=i-1)
    ws.cell(row=i,column=2,value=random.randint(1,100))
wb.save('测试0709.xlsx')

在上面的代码中,我们在第一列录入了序号,从1到98,第二列我们使用随机函数,随机录入了100以内的正整数。备注是空的没有填数据。

五、读取内容

现在表格里面已经有很多内容了,我们该如何读取其中的内容呢?

最简单的方式就是输入数据所在的坐标,然后输出,例如:

import openpyxl
wb=openpyxl.load_workbook('测试0709.xlsx')
ws=wb.active
print(ws['B3'].value)

下面我们来做一个简单的习题,比如说输出数值大于50的序号。

看到这个题目,我的思路首先是取出第一行的数据,然后判断B列的数值是否大于50,如果大于50,则输出A列的序号,我们尝试写下代码:

import openpyxl
wb=openpyxl.load_workbook('测试0709.xlsx')
ws=wb.active
for i in range(2,len(ws['A'])+1):
    if ws[f'B{i}'].value>50:
        print(ws[f'A{i}'].value)

运行结果是成功的,我还想到一个方法,不是每次取出每一行的内容,而是取出B列的内容,在进行大小比较,通过值的行属性来输出A列的值,我们来写下,看代码:

import openpyxl
wb=openpyxl.load_workbook('测试0709.xlsx')
ws=wb.active
B=ws['B']
for bi in B:
    if bi.value=='数值':
        pass
    else:
       if int(bi.value)>50:
            print(ws.cell(row=bi.row,column=1).value)

经运行也是成功的。

下面再将难度升级,将大于50的数据重新保存到一个新的EXCEL表格中,下面我们来试一试,看代码:

import openpyxl
wb=openpyxl.load_workbook('测试0709.xlsx')
ws=wb.active
rows=ws.rows
lis=[]
for row in rows:
    lis1=[]
    if row[1].value=='数值':
        pass
    else:
        if int(row[1].value)>50:
            for i in range(0,2):
                lis1.append(row[i].value)
            lis.append(lis1)
wb1=openpyxl.Workbook()
ws1=wb1.active
ws1['A1']='序号'
ws1['B1']='数值'
for x in lis:
    ws1.append(x)
wb1.save('大于50的表格.xlsx')

成功运行了,创建了一个新表格,里面数据都是数值大于50的,对里面一些代码进行说明:

“rows=ws.rows”,是将表格里的每一行作为列表全部返回,我们对每一行的数值进行判断完毕后,所以还是按照列表格式把每个单元格的数据添加到列表里,最后再把数据输入到新的EXCEL表格中。

六、插入删除行和列

在openpyxl中,可以使用以下方法插入、删除行和列:

1、插入行

在指定位置插入一行

ws.insert_rows(index=2)

在最后一行插入一行

ws.insert_rows(index=ws.max_row)

2、删除行

删除指定位置的行

ws.delete_rows(index=1)

删除最后一行

ws.delete_rows(index=ws.max_row-1)

3、插入列

在指定位置插入一列

ws.insert_cols(index=2)

在最后一列插入一列

ws.insert_cols(index=ws.max_column)

4、 删除列

删除指定位置的列

ws.delete_cols(index=1)

删除最后一列

ws.delete_cols(index=ws.max_column-1)


总结

openpyxl是一个Python库,用于读取、写入和操作Excel文件。它支持.xlsx格式的Excel文件,并提供了丰富的API来处理这些文件。以下是openpyxl的一些主要特点:

1、读写Excel文件:openpyxl可以读取和写入Excel文件,包括创建新的工作表、插入行和列、设置单元格值等操作。

2、支持多种数据类型:openpyxl支持多种数据类型,包括数字、日期、时间、字符串等。

3、提供公式计算:openpyxl可以对Excel文件中的数据进行计算,并将结果保存到单元格中。

4、支持样式设置:openpyxl可以设置单元格的字体、颜色、边框等样式。5、支持图表生成:openpyxl可以生成各种类型的图表,包括折线图、柱状图、饼图等。

6、兼容性好:openpyxl与Microsoft Excel的兼容性非常好,可以在Windows和Mac OS X上运行。

总之,openpyxl是一个功能强大、易于使用的Python库,可以帮助用户轻松地处理Excel文件。

相关文章
|
6天前
|
数据格式 Python
【Python】已解决:Excel无法打开文件test.xIsx“,因为文件格式或文件扩展名无效。请确定文件未损坏,并且文件扩展名与文件的格式匹配。
【Python】已解决:Excel无法打开文件test.xIsx“,因为文件格式或文件扩展名无效。请确定文件未损坏,并且文件扩展名与文件的格式匹配。
34 0
|
6天前
|
数据挖掘 Python
【Python】已解决:Python pandas读取Excel表格某些数值字段结果为NaN问题
【Python】已解决:Python pandas读取Excel表格某些数值字段结果为NaN问题
20 0
|
1天前
|
数据挖掘 开发者 Python
如何自学Python编程?
【7月更文挑战第14天】如何自学Python编程?
16 4
|
4天前
|
Python
不容错过!Python中图的精妙表示与高效遍历策略,提升你的编程艺术感
【7月更文挑战第11天】在Python编程中,图以邻接表或邻接矩阵表示,前者节省空间,后者利于查询连接。通过字典实现邻接表,二维列表构建邻接矩阵。图的遍历包括深度优先搜索(DFS)和广度优先搜索(BFS)。DFS使用递归,BFS借助队列。这些基础技巧对于解决复杂数据关系问题,如社交网络分析或迷宫求解,至关重要,能提升编程艺术。
13 5
|
2天前
|
数据格式 Python
Python代码示例,读取excel表格,将行数据转为列数据。(10)
【7月更文挑战第10天】Python代码示例,读取excel表格,将行数据转为列数据。
17 2
|
2天前
|
存储 对象存储 Python
`openpyxl`是一个用于读写Excel 2010 xlsx/xlsm/xltx/xltm文件的Python库。它不需要Microsoft Excel,也不需要.NET或COM组件。
`openpyxl`是一个用于读写Excel 2010 xlsx/xlsm/xltx/xltm文件的Python库。它不需要Microsoft Excel,也不需要.NET或COM组件。
6 1
|
4天前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
微软在 UserVoice 上运营着⼀个反馈论坛,每个⼈都可以在这⾥提交新点⼦供他⼈投票。票数最⾼的功能请求是“将 Python 作为Excel 的⼀门脚本语⾔”,其得票数差不多是第⼆名的两倍。尽管⾃2015 年这个点⼦发布以来并没有什么实质性进展,但在 2020 年年末,Python 之⽗ Guido van Rossum 发布推⽂称“退休太无聊了”,他将会加入微软。此事令 Excel ⽤户重燃希望。我不知道他的举动是否影响了 Excel 和 Python 的集成,但我清楚的是,为何⼈们迫切需要结合 Excel 和 Python 的⼒量,⽽你⼜应当如何从今天开始将两者结合起来。总之,这就是本
|
4天前
|
数据可视化 数据挖掘 数据处理
Python对Excel两列数据进行运算【从基础到高级的全面指南】
【7月更文挑战第6天】使用Python的`pandas`库处理Excel数据,涉及安装`pandas`和`openpyxl`,读取数据如`df = pd.read_excel('data.xlsx')`,进行运算如`df['Sum'] = df['Column1'] + df['Column2']`,并将结果写回Excel。`pandas`还支持数据筛选、分组、可视化、异常处理和性能优化。通过熟练运用这些功能,可以高效分析Excel表格。
9 0
|
6天前
|
开发者 Python
【Python】已解决:(pandas read_excel 读取Excel报错)ImportError: Pandas requires version ‘2.0.1’ or newer of ‘x
【Python】已解决:(pandas read_excel 读取Excel报错)ImportError: Pandas requires version ‘2.0.1’ or newer of ‘x
13 0
|
6天前
|
Python
【Python】已解决:(Python xlwt写入Excel样式报错)ValueError: More than 4094 XFs (styles)
【Python】已解决:(Python xlwt写入Excel样式报错)ValueError: More than 4094 XFs (styles)
9 0