老板让我处理上百个表格,最终我选择了Python自动化办公处理!

简介: 老板让我处理上百个表格,最终我选择了Python自动化办公处理!

1. 提出需求

这是群里面一位朋友提出的一个需求,具体需求是啥样的?我这里随意模拟出来两张表为大家解读一下。

image.png

对于上述的a表和b表,我们最终的目的就是:将a,b表中id相同的数据,写入一个sheet;a表中独有的id行写入一个sheet;b表中独有的id行写入一个sheet。


需要注意以下两点:

① 最终目的是创建一个工作簿,存放三个sheet表;

② 对于id相同的a,b两表,他们的姓名也是不同的,因此存放id相同的那张表,应该是3列。


2. 知识点讲解

为了解决这个问题,我们需要先讲述几个知识点,只有掌握了这几个知识点,解决这个问题将会变得灰常简单。


1)pd.merge()

这是Pandas中用于多表连接的函数,相当于Excel中的vlookup()函数,又相当于MySQL中的a join b on a.id = b.id内连接。


import pandas as pd
df1 = pd.read_excel("a.xlsx")
df2 = pd.read_excel("b.xlsx")
pd.merge(df1,df2,on="id")


结果如下:

image.png


2)pd.ExcelWriter()

ExcelWriter是pandas下面的一个类,里面有两个参数,一个是路径参数Path,一个是时间格式化参数datetime_format。


① ExcelWriter的两个作用

Ⅰ设置datetime的输出格式;

Ⅱ在一个工作簿中写入多个sheet表;


② 如何使用ExcelWriter

Ⅰ 构造数据


import pandas as pd
from datetime import datetime
df1 = pd.DataFrame(
    {
        "日期":[datetime(2020,7,1),datetime(2020,7,2)],
        "销售额":[10,20]
    }
)
df2 = pd.DataFrame(
    {
        "日期":[datetime(2020,8,1),datetime(2020,8,2)],
        "销售额":[15,25]
    }
)


结果如下:

image.png


Ⅱ ExcelWriter用法如下


# 如果不指定datetime_format参数,你可以试试最终效果。
with  pd.ExcelWriter("销售额.xlsx",datetime_format="YYYY-MM-DD") as writer:
    df1.to_excel(excel_writer=writer,sheet_name="1月",index=None)
    df2.to_excel(excel_writer=writer,sheet_name="2月",index=None)


结果如下:

image.png


3. 解决办法

有了上述的基础以后,我这里直接给出本文的代码,估计你看了就能学会的。

import pandas as pd
import os
# 指定路径
excel_name = os.getcwd() + "\\d.xlsx"
# 读取数据
df1 = pd.read_excel("a.xlsx")
df2 = pd.read_excel("b.xlsx")
# a,b表中共有的
df_a_b = pd.merge(df1,df2,on="id")
# a表独有的
df_a = df1[~df1["id"].isin(df2["id"])]
# b表独有的
df_b = df2[~df2["id"].isin(df1["id"])]
with  pd.ExcelWriter(excel_name) as writer:
    df_a.to_excel(excel_writer=writer,sheet_name="df_a",index=None)
    df_b.to_excel(excel_writer=writer,sheet_name="df_b",index=None)
    df_a_b.to_excel(excel_writer=writer,sheet_name="df_a_b",index=None)


结果如下:

image.png

相关文章
|
1月前
|
SQL 自然语言处理 数据库
【Azure Developer】分享两段Python代码处理表格(CSV格式)数据 : 根据每列的内容生成SQL语句
本文介绍了使用Python Pandas处理数据收集任务中格式不统一的问题。针对两种情况:服务名对应多人拥有状态(1/0表示),以及服务名与人名重复列的情况,分别采用双层for循环和字典数据结构实现数据转换,最终生成Name对应的Services列表(逗号分隔)。此方法高效解决大量数据的人工处理难题,减少错误并提升效率。文中附带代码示例及执行结果截图,便于理解和实践。
|
22天前
|
人工智能 安全 虚拟化
Cua:Mac用户狂喜!这个开源框架让AI直接接管你的电脑,快速实现AI自动化办公
Cua是一个结合高性能虚拟化与AI代理能力的开源框架,能在Apple Silicon上以接近原生性能运行虚拟机,并让AI直接操作系统应用。
152 17
Cua:Mac用户狂喜!这个开源框架让AI直接接管你的电脑,快速实现AI自动化办公
|
13天前
|
人工智能 运维 API
无需配置开箱即用!MoLing:基于MCP开发的自动化办公服务,一键搞定文件与网页操作
MoLing是一款基于Go语言开发的跨平台办公自动化工具,通过操作系统API和浏览器自动化框架实现文件操作、命令执行及网页控制,无需额外依赖即可运行。
81 1
无需配置开箱即用!MoLing:基于MCP开发的自动化办公服务,一键搞定文件与网页操作
|
4月前
|
搜索推荐 Python
使用Python自动化生成物业通知单
本文介绍如何使用Python结合Pandas和python-docx库自动化生成物业通知单。通过读取Excel数据并填充至Word模板,实现高效准确的通知单批量制作。包括环境准备、代码解析及效果展示,适用于物业管理场景。
128 14
|
4月前
|
数据处理 索引 Python
用Python实现数据录入、追加、数据校验并生成表格
本示例展示了如何使用Python和Pandas库实现学生期末考试成绩的数据录入、追加和校验,并生成Excel表格。首先通过`pip install pandas openpyxl`安装所需库,然后定义列名、检查并读取现有数据、用户输入数据、数据校验及保存至Excel文件。程序支持成绩范围验证,确保数据准确性。
164 14
|
4月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
614 10
|
4月前
|
Python
自动化微信朋友圈:Python脚本实现自动发布动态
本文介绍如何使用Python脚本自动化发布微信朋友圈动态,节省手动输入的时间。主要依赖`pyautogui`、`time`、`pyperclip`等库,通过模拟鼠标和键盘操作实现自动发布。代码涵盖打开微信、定位朋友圈、准备输入框、模拟打字等功能。虽然该方法能提高效率,但需注意可能违反微信使用条款,存在风险。定期更新脚本以适应微信界面变化也很重要。
381 61
|
1月前
|
机器学习/深度学习 设计模式 测试技术
Python 高级编程与实战:构建自动化测试框架
本文深入探讨了Python中的自动化测试框架,包括unittest、pytest和nose2,并通过实战项目帮助读者掌握这些技术。文中详细介绍了各框架的基本用法和示例代码,助力开发者快速验证代码正确性,减少手动测试工作量。学习资源推荐包括Python官方文档及Real Python等网站。
|
4月前
|
Python Windows
Python实现常用办公文件格式转换
本文介绍了如何使用Python及其相关库(如`pandas`、`openpyxl`、`python-docx`等)实现办公文件格式间的转换,包括XLS转XLSX、DOC转DOCX、PPT转PPTX、Word转PDF及PDF转Word,并提供了具体代码示例和注意事项。
269 89
|
2月前
|
存储 数据采集 数据格式
Python自动化Office文档处理全攻略
本文介绍如何使用Python自动化处理Word、Excel和PDF文档,提升办公效率。通过安装`python-docx`、`openpyxl`、`pandas`、`PyPDF2`和`pdfplumber`等库,可以轻松实现读取、修改、创建和批量处理这些文档。具体包括:自动化处理Word文档(如读取、修改内容、调整样式),Excel文档(如读取、清洗、汇总数据),以及PDF文档(如提取文本和表格数据)。结合代码示例和实战案例,帮助你掌握高效办公技巧,减少手动操作的错误率。
103 1

热门文章

最新文章