【python接口自动化】- openpyxl读取excel数据

简介:

【python接口自动化】- openpyxl读取excel数据

前言:目前我们进行测试时用于存储测试数据的软件几乎都是excel,excel方便存储和管理数据,读取数据时也比较清晰,测试时我们需要从excel从读取测试数据,结束后还需把测试结果写入到excel中,读取这一动作以往都是通过人工来操作,学会使用openpyxl后,就可以实现自动化地读取数据,解放双手。

1|0openpyxl简单介绍

​ openpyxl是一个开源项目,它是一个用于读取/写入Excel 2010文档(如xlsx 、xlsm 、xltx 、xltm文件 )的Python库,如果要处理更早格式的Excel文档(xls),需要用到其它库(如:xlrd、xlwt等),这是openpyxl比较其他模块的不足之处。openpyxl是一款比较综合的工具,不仅能够同时读取和修改Excel文档,而且可以对Excel文件内单元格进行详细设置,包括单元格样式等内容,甚至还支持图表插入、打印设置等内容。

​ python中与excel操作相关的模块:

📔 xlrd库:从excel中读取数据,支持xls、xlsx格式
📔 xlwt库:对excel进行修改操作,但不支持对xlsx格式的修改
📔 xlutils库:在xlwt和xlrd中,对一个已存在文件进行修改
📘 openpyxl库:主要针对xlsx格式的excel进行读取和编辑
2|0openpyxl的安装

pip install openpyxl

3|0openpyxl的三个基本概念

WorkBook:工作簿对象
Sheet:表单对象
Cell:表格对象
​ 也就是我们使用excel时可以看到的三个对象,我们操作excel的步骤是打开工作簿,选中表单,对单元格进行操作,而openpyxl的工作原理也是如此。

3|1openpyxl对excel进行操作

3|2新建excel

​ 运行以下代码后,就会发现项目中多了一个excel文件。

import openpyxl # 创建一个工作簿 workbook = openpyxl.Workbook() # 创建一个表单 sheet = workbook.create_sheet('表单1') # 写入一个数据 sheet.cell(row=1, column=1, value="python") # 保存 workbook.save('test.xlsx')

​ 🎈 注意点:如果保存的文件名已存在,将会覆盖原来的文件

3|3打开已存在的文件

打开已存在的文件:load_workbook()
获取表单:workbook['表单名']
读取指定表格:cell(row, column).value
import openpyxl # 打开工作簿 workbook = openpyxl.load_workbook('test.xlsx') # 获取表单 sheet = workbook['表单1'] # 读取指定的单元格数据 cell = sheet.cell(row=1, column=1).value print(cell)

​ 运行结果:

C:softwarepythonpython.exe D:/learn/python24/python_base/test.py python Process finished with exit code 0

3|4读取单个单元格

方式一:读取A6单元格的值 cell1 = sheet['A6'].value # 方式二:读取第3行,第4列单元格的值 cell2 = sheet.cell(row=3, column=4).value

3|5读取多个单元格

读取A1-B4的单元格,共8个单元格 cell3 = sheet['A1':'B4'] # 读取A1-B4的单元格,共8个单元格 cell4 = sheet['A1:B4'] # 读取第2行的单元格 cell5 = sheet[2] # 读取第1-2行的单元格 cell5 = sheet[1:2]

​ 读取多个单元格时,都是以元组的形式返回

3|6其他相关操作

关键代码 相关描述
cell(row, column, value) 写入数据,三个参数分别是行,列,值
cell(row, column).value 获取指定单元格的值,两个参数分别是行,列
workbook.remove('表单名') 删除表单
del workbook['表单名'] 删除表单
workbook.save('文件名') 保存工作簿
sheet.max_row 获取表单数据的总行数
sheet.max_column 获取表单数据的总列数
sheet.rows 获取按行所有的数据
sheet.columns 获取按列所有的数据
​ 🎈 注意点:

openpyxl中列和行的起始标识都是1,不是从0开始
从excel中读取出来的数据只有两种类型,即数值类型和字符串类型
不要随便在表格中敲空格,会影响判断最大行数和最大列数
运行操作excel的代码时,要先关闭在操作系统中打开的相关excel表,否则可能会无法读取/写入数据
写入数据时要执行保存
import openpyxl # 打开工作簿 wb = openpyxl.load_workbook('test.xlsx') # 获取表单 sh = wb['表单1'] # 读取指定的单元格数据 res1 = sh.cell(row=1, column=1).value print(res1) # 获取最大行数 print(sh.max_row) # 获取最大列数 print(sh.max_column) # 按列读取所有数据,每一列的单元格放入一个元组中 print(sh.columns) # 直接打印,打印结果是一个可迭代对象,我们可以转换成列表来查看 # 按行读取所有数据,每一行的单元格放入一个元组中 rows = sh.rows # print(list(rows)) # 转换成列表之后打印结果为具体的单元格,如下 # [(, , , , , , ), # (, , , , , , ), # (, , , , , , )] # 我们可以通过for循环以及value来查看单元格的值 for row in list(rows): # 遍历每行数据 case = [] # 用于存放一行数据 for c in row: # 把每行的每个单元格的值取出来,存放到case里 case.append(c.value) print(case)

​ 运行结果:

C:softwarepythonpython.exe D:/learn/python24/python_base/test.py case_id 3 7 ['case_id', 'interface', 'title', 'method', 'url', 'data', 'expected'] [1, 'login', '登录成功', 'post', '/member/login', '{"mobile_phone":"15692004245","pwd":"miki12345"}', "{'code': 0, 'msg': 'OK'}"] [2, 'login', '登录失败-手机号为空', 'post', '/member/login', '{"mobile_phone":"","pwd":"miki12345"}', "{'code': 2, 'msg': '手机号码为空'}"]

​ excel表中的原数据如下图:

4|0openpyxl封装

​ 在测试过程中,我们会经常需要访问excel读取测试数据,如果毎访问一次我们就调用一次openpyxl,进行打开excel,选取表单,读取数据等操作,将会增加我们的工作量和代码量。凡是需要重复使用的,我们都可以对它进行二次封装,写成我们自己的版本,还可以在封装过程中加入我们想要的内容,使用的时候直接调用即可。

​ 在封装openpyxl时,读取excel时我写了两种实现方法,第一种是读取数据后,把每条测试数据的键值保存到一个字典中,再把字典存到一个列表,这种方式比较容易理解,但是调用的时候需要多敲几个括号或者引号;第二种是把每条测试数据的键值存到一个实例对象的属性中,再把每个实例存到一个列表。实际上他们的作用是一样,只是第二种方式调用时更简单。

read_excel.py import openpyxl class CasesData: """用于保存测试用例数据""" pass class ReadExcel: """用于读写excel数据""" def init__(self, file_name, sheet_name): """ :param file_name: excle文件名 :param sheet_name: 表单名 """ self.file_name = file_name self.sheet_name = sheet_name def open(self): """打开工作簿,选中表单""" self.wb = openpyxl.load_workbook(self.file_name) self.sh = self.wb[self.sheet_name] def close(self): """关闭工作簿对象的方法""" self.wb.close() def read_data(self): """按行读取数据,最后返回一个存储字典的列表""" self.open() # 打开工作簿 rows = list(self.sh.rows) # 按行读取所有数据 titles = [] # 用于存放用例的标题 for t in rows[0]: title = t.value titles.append(title) cases = [] # 用于存放所有的测试数据 for row in rows[1:]: case = [] # 用于存放单条测试用例数据 for r in row: case.append(r.value) cases.append(dict(zip(titles, case))) # 通过zip聚合打包用例的标题和数据 self.close() return cases def read_data_obj(self): """按行读取数据,最后返回的是一个存储实例对象的列表""" self.open() # 打开工作簿,选中表单 rows = list(self.sh.rows) # 按行读取所有数据 titles = [] # 用于存放用例的标题 for t in rows[0]: title = t.value titles.append(title) cases = [] # 用于存放所有的测试数据 for row in rows[1:]: case_obj = CasesData() # 创建一个对象用来保存该行用例数据 case = [] # 用于保存单条测试用例数据 for r in row: case.append(r.value) case_info = dict(zip(titles, case)) # 通过zip聚合打包用例的标题和数据 for k, v in case_info.items(): # 把该行测试用例标题和数据遍历出来,设成对象的属性 setattr(case_obj, k, v) cases.append(case_obj) self.close() return cases def write_data(self, row, column, msg): """写入数据的方法""" self.open() self.sh.cell(row=row, column=column, value=msg) self.wb.save(self.filename) self.close() if __name == '__main__': # 直接运行本文件时执行,下面是一个应用实例 # 需要读取excel时直接调用ReadExcel类 test = ReadExcel('cases.xlsx', 'login') res = test.read_data_obj() # 最后返回的是一个存储实例对象的列表 print(res[0].case_id) # 打印第1个用例的case_id print(res[3].title) # 打印第4个用例的title test2 = ReadExcel('cases.xlsx', 'login') res2 = test2.read_data() # 最后返回一个存储字典的列表 print(res20) # 打印第1个用例的case_id print(res23) # 打印第4个用例的title

​ 上面封装的openpyxl中,应用实例的excel表结构如下:

EOF

本文作者:miki的测试笔记
本文链接:https://www.cnblogs.com/miki-peng/p/12904383.html

相关文章
|
20天前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
|
21天前
|
数据采集 存储 XML
Python爬虫:深入探索1688关键词接口获取之道
在数字化经济中,数据尤其在电商领域的价值日益凸显。1688作为中国领先的B2B平台,其关键词接口对商家至关重要。本文介绍如何通过Python爬虫技术,合法合规地获取1688关键词接口,助力商家洞察市场趋势,优化营销策略。
|
4天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
24 2
|
11天前
|
数据采集 存储 API
利用Python爬虫获取1688关键词接口全攻略
本文介绍如何使用Python爬虫技术合法合规地获取1688关键词接口数据,包括环境准备、注册1688开发者账号、获取Access Token、构建请求URL、发送API请求、解析HTML及数据处理存储等步骤,强调遵守法律法规和合理使用爬虫技术的重要性。
|
18天前
|
数据采集 分布式计算 大数据
构建高效的数据管道:使用Python进行ETL任务
在数据驱动的世界中,高效地处理和移动数据是至关重要的。本文将引导你通过一个实际的Python ETL(提取、转换、加载)项目,从概念到实现。我们将探索如何设计一个灵活且可扩展的数据管道,确保数据的准确性和完整性。无论你是数据工程师、分析师还是任何对数据处理感兴趣的人,这篇文章都将成为你工具箱中的宝贵资源。
|
21天前
|
JSON 安全 API
Python调用API接口的方法
Python调用API接口的方法
93 5
|
19天前
|
敏捷开发 测试技术 持续交付
自动化测试之美:从零开始搭建你的Python测试框架
在软件开发的马拉松赛道上,自动化测试是那个能让你保持节奏、避免跌宕起伏的神奇小助手。本文将带你走进自动化测试的世界,用Python这把钥匙,解锁高效、可靠的测试框架之门。你将学会如何步步为营,构建属于自己的测试庇护所,让代码质量成为晨跑时清新的空气,而不是雾霾中的忧虑。让我们一起摆脱手动测试的繁琐枷锁,拥抱自动化带来的自由吧!
|
1月前
|
传感器 物联网 开发者
使用Python读取串行设备的温度数据
本文介绍了如何使用Python通过串行接口(如UART、RS-232或RS-485)读取温度传感器的数据。详细步骤包括硬件连接、安装`pyserial`库、配置串行端口、发送请求及解析响应等。适合嵌入式系统和物联网应用开发者参考。
46 3
|
1月前
|
运维 监控 网络安全
自动化运维的崛起:如何利用Python脚本简化日常任务
【10月更文挑战第43天】在数字化时代的浪潮中,运维工作已从繁琐的手工操作转变为高效的自动化流程。本文将引导您了解如何运用Python编写脚本,以实现日常运维任务的自动化,从而提升工作效率和准确性。我们将通过一个实际案例,展示如何使用Python来自动部署应用、监控服务器状态并生成报告。文章不仅适合运维新手入门,也能为有经验的运维工程师提供新的视角和灵感。
|
1月前
|
数据采集 JavaScript 程序员
探索CSDN博客数据:使用Python爬虫技术
本文介绍了如何利用Python的requests和pyquery库爬取CSDN博客数据,包括环境准备、代码解析及注意事项,适合初学者学习。
77 0