Python办公自动化【Excel数据拆分-xlrd、Excel读取数据-openpyxl、Excel写入数据-openpyxl】(二)-全面详解(学习总结---从入门到深化)

简介: Python办公自动化【Excel数据拆分-xlrd、Excel读取数据-openpyxl、Excel写入数据-openpyxl】(二)-全面详解(学习总结---从入门到深化)

Excel数据汇总



数据汇总是Excel中常用的功能,而在Python中使用通过遍历所有单元格即可实现


代码

import xlrd
from xlutils.copy import copy
def read_data():
  wb = xlrd.open_workbook('./base_data/data01.xlsx')
  sh = wb.sheet_by_index(0)
  fen_type = {}    # {a:110,b:300}
  count_price = []   # [1,2,3,4,5,6]
  for r in range(sh.nrows):
    count = sh.cell_value(r,3) * sh.cell_value(r,4)
    count_price.append(count)
    key = sh.cell_value(r,0)
    if fen_type.get(key):
      fen_type[key] += count
    else:
      fen_type[key] = count
  return fen_type,count_price # 各分类的总价值, 每个单品的总价值
def save(fen,count):
  wb = xlrd.open_workbook('./base_data/data01.xlsx')
  sh_t = wb.sheet_by_index(0)
  wb2 = copy(wb)
  sh = wb2.get_sheet(0)
  for r in range(sh_t.nrows):
    sh.write(r,sh_t.ncols,count[r])
  sh2 = wb2.add_sheet('汇总的数据')
  for i,key in enumerate(fen.keys()):
    sh2.write(i,0,key)
    sh2.write(i,1,fen.get(key))
  wb2.save('./create_data/05_汇总数据.xlsx')
if __name__ == "__main__":
  f,c = read_data()
  save(f,c)


问题

xlrd.biffh.XLRDError: Excel xlsx file; not supported

解决方案:

更换版本

pip uninstall xlrd
pip install xlrd==1.2.0


Excel数据拆分-xlrd



代码

import xlrd
from xlutils.copy import copy
def get_data():
  wb = xlrd.open_workbook('./base_data/data01.xlsx')
  sh = wb.sheet_by_index(0)
  '''
 {
  a: [{},{},{}],
  b:[{},{},{}],
  c:[{},{},{}],
 }
 '''
  all_data = {}
  for r in range(sh.nrows):
    d = {'type':sh.cell_value(r,1),'name':sh.cell_value(r,2),'count':sh.cell_value(r,3),'price':
sh.cell_value(r,4)}
    key = sh.cell_value(r,0)
    if all_data.get(key):
      all_data[key].append(d)
    else:
      all_data[key] = [d]
  return all_data
def save(data):
  wb = xlrd.open_workbook('./base_data/data01.xlsx')
  wb2 = copy(wb)
  for key in data.keys():
    temp_sheet = wb2.add_sheet(key)
    for i, d in enumerate(data.get(key)):
 temp_sheet.write(i,0,d.get('type'))
 temp_sheet.write(i,1,d.get('name'))
 temp_sheet.write(i,2,d.get('count'))
 temp_sheet.write(i,3,d.get('price'))
  wb2.save('./create_data/06_表格的拆分.xlsx')
if __name__ == "__main__":
  all_data = get_data()
 # save(all_data)
  print(all_data)


Excel读取数据-openpyxl



Python操作Excel的一个常用库openpyxl,openpyl是第3方模块库,可以方便的对excel执行读取与写入操作


安装

pip install openpyxl


常用方法与属性

函数名&属性  含义
openpyxl.load_workbook(path)  加载Excel文件
workbook.active  激活第1个工作薄
workbook[name]  获取根据名字工作薄
workbook.get_sheet_by_name(name)  获取根据名字工作薄
workbook.sheetnames  获取所有工作薄名字
sheet.title  获取工作薄名字
sheet.max_row  获取行数
sheet.max_column  获取列数
sheet.cell(row,col)  获取指定单元格
sheet[cell_name]  获取指定单元格,例如: C2
sheet[col/row_name] 获取整行或整列单元格:填写num为整
行,row_name为整列
sheet[col:col]  获取指定范围整行单元格
sheet[cell_name:cell_name]  获取指定范围单元格
sheet.iter_rows(min_row =0 , max_row =0, min_col =0,
max_col =0)
获取指定范围单元格
sheet.rows  获取所有行
sheet.columns  获取所有列
cell.value  获取单元格的值


代码

# pip install openpyxl
def open():
  from openpyxl import load_workbook
  wb = load_workbook('./base_data/data01.xlsx')
  # 获取工作薄
  sh1 = wb.active
  sh2 = wb['Sheet1']
  sh3 = wb.get_sheet_by_name('Sheet1')
  print(sh1 is sh2 is sh3)
def show_sheets():
  from openpyxl import load_workbook
  wb = load_workbook('./base_data/data01.xlsx')
  print(wb.sheetnames)
  for sh in wb:
    print(sh.title)
def get_one_value():
  from openpyxl import load_workbook
  wb = load_workbook('./base_data/data01.xlsx')
  sh1 = wb.active
  value1 = sh1.cell(2,3).value
  value2 = sh1['c2'].value
  print(value1,value2)
def get_many_value():
  from openpyxl import load_workbook
  wb = load_workbook('./base_data/data01.xlsx')
  sh1 = wb['Sheet1']
  # 切片
  cells1 = sh1['c2':'d3']
  # print(cells1)
  # 整行,整列
  cell_row3 = sh1[3]
  cell_col3 = sh1['c']
  print(cell_row3)
  print(cell_col3)
  cell_row3_5 = sh1[3:5]
  print(cell_row3_5)
  # 通过迭代获取数据
  # for row in sh1.iter_rows(min_row =2 , max_row =5, max_col =3):
  #   for cell in row:
  #     print(cell.value)
  for row in sh1.iter_rows(min_row =2 , max_row =5, min_col =2, max_col =4):
    for cell in row:
      print(cell.value)
def get_all_data():
  from openpyxl import load_workbook
  wb = load_workbook('./base_data/data01.xlsx')
  sh1 = wb['Sheet1']
  for row in sh1.rows:
    for cell in row:
      print(cell.value)
  for column in sh1.columns:
    for cell in column:
      print(cell.value)
def get_num():
  from openpyxl import load_workbook
  wb = load_workbook('./base_data/data01.xlsx')
  sh1 = wb['Sheet1'] 
  print(sh1.max_row)
  print(sh1.max_column)
if __name__ == "__main__":
  # open()
  # show_sheets()
  # get_one_value()
  # get_many_value()
  # get_all_data()
  get_num()


Excel写入数据-openpyxl



常用方法与属性

函数名&属性  含义
Workbook()  创建Excel文件
workbook.create_sheet(name, <num> )  在指定位置创建sheet表
cell.value  获取单元格值,也可直接赋值
cell.font  获取字体样式,也可直接赋值
cell.alignment  获取单元格内容位置,也可直接赋值
openpyxl.styles.Font()  创建字体样式
openpyxl.styles.Alignment()  创建单元格内容位置样式
sheet.row_dimensions[num].height  设置指定行高度
sheet.column_dimensions[col_name].width  设置指定列宽度


代码

from openpyxl import Workbook
def create_excel():
  # 创建excel
  wb = Workbook()
  # 激活第1个工作薄
  ws1 = wb.active
  # 创建工作薄
  ws2 = wb.create_sheet('数据')
  # 在指定位置创建工作薄、
   ws3 = wb.create_sheet('人员',0)
  # 保存数据
  wb.save('./create_data/09_创建excel文件.xlsx')
def set_value1():
  # 创建excel
  wb = Workbook()
  # 激活第1个工作薄
  ws1 = wb.active
  # 写入数据
  ws1['A1'] = 'Hello'
  ws1['B2'] = 'Excel'
  ws1['C3'] = 'Python'
  # 保存数据
  wb.save('./create_data/10_创建excel文件_写入数据.xlsx')
def set_value2():
  # 创建excel
  wb = Workbook()
  # 激活第1个工作薄
  ws1 = wb.active
  # 需要写入的数据
  data = ['Hello','Excel','Python']
  for i,d in enumerate(data):
    ws1.cell(i+1,i+1).value = d  # 注意 openpyxl里面 记数是从1开始
  # 保存数据
  wb.save('./create_data/11_创建excel文件_写入数据2.xlsx')
def set_value3():
  # 创建excel
  wb = Workbook()
  # 激活第1个工作薄
  ws1 = wb.active
  # 需要写入的数据
  data = ['Hello','Excel','Python']
  # 把数据追加到工作薄
  ws1.append(data)
  # 保存数据
  wb.save('./create_data/12_创建excel文件_写入数据3.xlsx')
if __name__ == '__main__':
  # create_excel()
  # set_value1()
  # set_value2()
  set_value3()


Excel写入样式-openpyxl



常用方法与属性


函数名&属性  含义
Workbook()  创建Excel文件
openpyxl.styles.Font()  创建字体样式
openpyxl.styles.Alignment()  创建单元格内容位置样式
sheet.column_dimensions[col_name].width  设置指定列宽度
sheet.row_dimensions[num].height  设置指定行高度
openpyxl.styles.Border()  设置边框样式
openpyxl.styles.Side()  设置边的样式
openpyxl.styles.PatternFill()  设置背景样式
cell.font  获取字体样式,也可直接赋值
cell.alignment  获取单元格内容位置,也可直接赋值
cell.border  获取边框样式,也可直接赋值
cell.fill  获取背景样式,也可直接赋值
openpyxl.styles.colors  设置颜色


代码


字体样式与内容位置样式代码

from openpyxl import Workbook
from openpyxl.styles import
Font,colors,Alignment
def set_font():
 '''
 设置字体样式
 '''
  wb = Workbook()
  ws = wb.active
  ws['A1'] = 'Hello'
  ws['B2'] = 'Python'
  ws['C3'] = 'Excel'
  # 创建一个字体样式对象
  ft = Font(name='微软雅黑',size=30,italic=True,bold=True,color=colors.BLUE)
  ft2 = Font(name='微软雅黑',size=30,italic=True,bold=True,color='CDAD00')
  # 将字体的样式应用到单元格
  ws['B2'].font = ft
  ws['C3'].font = ft2
  # 保存数据
  wb.save('./create_data/13_openpyxl_字体样式.xlsx')
def set_aligment():
 '''
设置内容对齐方式
 '''
  wb = Workbook()
  ws = wb.active
  ws['A1'] = 'Hello'
  ws['B2'] = 'Python'
  ws['C3'] = 'Excel'
  # 创建一个对齐方式对象
  aligment = Alignment(horizontal='left',vertical='top')
  aligment2 = Alignment(horizontal='right',vertical='bottom')
  # 设置单元格的宽与高
  ws.row_dimensions[1].height = 50
  ws.column_dimensions['A'].width = 50
  ws['B2'].alignment = aligment
  ws['C3'].alignment = aligment2
  # 保存数据
  wb.save('./create_data/14_openpyxl_位置样式.xlsx')
if __name__ =='__main__':
  # set_font()
  set_aligment()


边框样式与背景样式代码

from openpyxl import Workbook
from openpyxl.styles import
Border,Side,colors,PatternFill
def set_border():
  '''
 设置边框样式
 '''
  wb = Workbook()
  ws = wb.active
  ws['A1'] = 'Hello'
  ws['B2'] = 'Python'
  ws['C3'] = 'Excel'
  # 创建一个线的样式对象
  side = Side(color=colors.BLUE,style='medium')
  side2 = Side(color='00008000',style='double')
  # 创建边框样式对象
  border = Border(left=side,right=side2,top=side,bottom =side2)
  # 将边框样式应用到单元格
  ws['B2'].border = border
  # 保存数据
  wb.save('./create_data/15_openpyxl_边框样式.xlsx')
def set_pattern():
  '''
 设置背景颜色
 '''
  wb = Workbook()
  ws = wb.active
  ws['A1'] = 'Hello'
  ws['B2'] = 'Python'
  ws['C3'] = 'Excel'
  # 创建背景的样式对象
  pattern = PatternFill('solid',fgColor=colors.BLUE)
  # 将背景颜色样式应用单元格, 不要用pattern属性
  ws['B2'].fill = pattern # AttributeError: 'Cell' object has no attribute 'pattern'
  # 保存数据
  wb.save('./create_data/16_openpyxl_背景样式.xlsx')
if __name__ =='__main__':
  # set_border()
  set_pattern()


目录
相关文章
|
10天前
|
Python
自动化微信朋友圈:Python脚本实现自动发布动态
本文介绍如何使用Python脚本自动化发布微信朋友圈动态,节省手动输入的时间。主要依赖`pyautogui`、`time`、`pyperclip`等库,通过模拟鼠标和键盘操作实现自动发布。代码涵盖打开微信、定位朋友圈、准备输入框、模拟打字等功能。虽然该方法能提高效率,但需注意可能违反微信使用条款,存在风险。定期更新脚本以适应微信界面变化也很重要。
112 60
|
5天前
|
数据可视化 数据挖掘 大数据
1.1 学习Python操作Excel的必要性
学习Python操作Excel在当今数据驱动的商业环境中至关重要。Python能处理大规模数据集,突破Excel行数限制;提供丰富的库实现复杂数据分析和自动化任务,显著提高效率。掌握这项技能不仅能提升个人能力,还能为企业带来价值,减少人为错误,提高决策效率。推荐从基础语法、Excel操作库开始学习,逐步进阶到数据可视化和自动化报表系统。通过实际项目巩固知识,关注新技术,为职业发展奠定坚实基础。
|
14天前
|
Python
Python学习的自我理解和想法(10)
这是我在千锋教育B站课程学习Python的第10天笔记,主要学习了函数的相关知识。内容包括函数的定义、组成、命名、参数分类(必须参数、关键字参数、默认参数、不定长参数)及调用注意事项。由于开学时间有限,记录较为简略,望谅解。通过学习,我理解了函数可以封装常用功能,简化代码并便于维护。若有不当之处,欢迎指正。
|
2天前
|
存储 安全 数据可视化
用Python实现简单的任务自动化
本文介绍如何使用Python实现任务自动化,提高效率和准确性。通过三个实用案例展示:1. 使用`smtplib`和`schedule`库自动发送邮件提醒;2. 利用`shutil`和`os`库自动备份文件;3. 借助`requests`库自动下载网页内容。每个案例包含详细代码和解释,并附带注意事项。掌握这些技能有助于个人和企业优化流程、节约成本。
28 3
|
22天前
|
JSON 数据可视化 测试技术
python+requests接口自动化框架的实现
通过以上步骤,我们构建了一个基本的Python+Requests接口自动化测试框架。这个框架具有良好的扩展性,可以根据实际需求进行功能扩展和优化。它不仅能提高测试效率,还能保证接口的稳定性和可靠性,为软件质量提供有力保障。
54 7
|
1月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
120 10
|
3月前
|
数据采集 存储 JavaScript
自动化数据处理:使用Selenium与Excel打造的数据爬取管道
本文介绍了一种使用Selenium和Excel结合代理IP技术从WIPO品牌数据库(branddb.wipo.int)自动化爬取专利信息的方法。通过Selenium模拟用户操作,处理JavaScript动态加载页面,利用代理IP避免IP封禁,确保数据爬取稳定性和隐私性。爬取的数据将存储在Excel中,便于后续分析。此外,文章还详细介绍了Selenium的基本设置、代理IP配置及使用技巧,并探讨了未来可能采用的更多防反爬策略,以提升爬虫效率和稳定性。
186 4
|
12天前
|
存储 Java easyexcel
招行面试:100万级别数据的Excel,如何秒级导入到数据库?
本文由40岁老架构师尼恩撰写,分享了应对招商银行Java后端面试绝命12题的经验。文章详细介绍了如何通过系统化准备,在面试中展示强大的技术实力。针对百万级数据的Excel导入难题,尼恩推荐使用阿里巴巴开源的EasyExcel框架,并结合高性能分片读取、Disruptor队列缓冲和高并发批量写入的架构方案,实现高效的数据处理。此外,文章还提供了完整的代码示例和配置说明,帮助读者快速掌握相关技能。建议读者参考《尼恩Java面试宝典PDF》进行系统化刷题,提升面试竞争力。关注公众号【技术自由圈】可获取更多技术资源和指导。
|
5月前
|
关系型数据库 MySQL Shell
不通过navicat工具怎么把查询数据导出到excel表中
不通过navicat工具怎么把查询数据导出到excel表中
58 0
|
3月前
|
数据处理 Python
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
这篇文章介绍了如何使用Python读取Excel文件中的数据,处理后将其保存为txt、xlsx和csv格式的文件。
174 3
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档