只需10行代码就能对Excel文件进行批量去重~

简介: 大家好,我是志斌~我今天就来跟大家分享一下:如何实现不同的Excel文件去重,并重新写入~

01去重


我们使用Pandas库的drop_duplicates(subset=None, keep=‘first’, inplace=False)功能来对Excel文件中的重复项进行删除。


其中,subset参数代表指定列标记,默认当每一条行记录完全相同时,才会认定为重复行;keep=‘’有‘first’、‘last’和‘False’,意思是删除重复行时,保留first还是last还是全部删除,默认参数是‘first’;inplace=‘’有True和Flase,意思是直接替换还是保留副本,默认值是Flase。


01 读取Excel


import pandas as pd
df = pd.read_excel('全部.xlsx')




59.png


选中列去重


df.drop_duplicates(['用户名称'])


60.png


其中第2、3行的用户名称与第0、1行重复,所以被删除。


03 保存最后一个重复数据


df.drop_duplicates(['用户名称'],keep='last')



61.png


因为我们设定保存最后一个重复数据,所以删除了第0、1行数据。


04

保存Excel


df.to_excel('去重后.xlsx')


02批量获取Excel文件


在上面我们已经学会如何对单个Excel文件去重了,但是在读取文件名的时候,我们还是需要手动输入的,如果文件很多的话,我们要一个一个的输入,这不仅麻烦,而且也不符合自动化办公的名头。所以,我们就需要想办法取得该目录下的所有Excel文件。


这里我们用的是Pathlib库,取得该目录下所有的xlsx格式文件。

path = 'K:\自动化办公'


将该目录下所有文件存储到files列表中,代码如下:

files = []
p = Path(src_path)
for x in p.iterdir():
  if PurePath(x).match('*.xlsx'):
      files.append(x)


03

小结


批量对Excel文件去重的思路是:

1. 获取该目录下所有的Excel文件,并存入一个列表中。

2. 依次循环列表中文件,进行去重。

3. 每去重完一个文件,进行一次保存。

4. 本文仅供学习参考,不做它用。

相关文章
|
6天前
|
Java 关系型数据库 MySQL
【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口(下)
【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口
44 0
|
6天前
|
Java 关系型数据库 MySQL
【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口(上)
【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口
47 0
|
6天前
aspose实现word,excel等文件预览
aspose实现word,excel等文件预览
|
5天前
|
Java Apache 索引
POI操作大全(动态合并单元格,为单元格生成一个自定义的数据显示格式,自定义公式计算结果生成,读取excel,word文件在生成图片,word指定位置生成图片)
POI操作大全(动态合并单元格,为单元格生成一个自定义的数据显示格式,自定义公式计算结果生成,读取excel,word文件在生成图片,word指定位置生成图片)
|
6天前
|
前端开发 关系型数据库 MySQL
【MySQL × SpringBoot 突发奇想】全面实现流程 · 数据库导出Excel表格文件的接口
【MySQL × SpringBoot 突发奇想】全面实现流程 · 数据库导出Excel表格文件的接口
38 0
|
6天前
|
Python
python如何读取excel文件,并修改内容?
python如何读取excel文件,并修改内容?
22 0
|
6天前
|
XML 存储 安全
基于 ABAP OLE 和 abap2xlsx 两种技术方案对 Excel 文件进行读写的优缺点比较
基于 ABAP OLE 和 abap2xlsx 两种技术方案对 Excel 文件进行读写的优缺点比较
5 0
|
6天前
|
数据挖掘 数据处理 索引
使用Pandas从Excel文件中提取满足条件的数据并生成新的文件
使用Pandas从Excel文件中提取满足条件的数据并生成新的文件
9 1
|
6天前
|
easyexcel BI
excel合并列导出文件
excel合并列导出文件
|
6天前
|
JSON JavaScript 前端开发
使用JavaScript和XLSX.js将数据导出为Excel文件
使用JavaScript和XLSX.js将数据导出为Excel文件
27 0