6000字长文,带你用Python完成 “Excel合并(拆分)” 的各种操作!(一)

简介: 6000字长文,带你用Python完成 “Excel合并(拆分)” 的各种操作!(一)

一、概述


其实Excel合并这个需求,应该是一个极为普遍的需求了。今天我们就利用Python完成“Excel合并(拆分)” 操作,具体如下:


① 将多个Excel表,合并到一个Excel中(每个Excel中只有一个sheet表);

② 将多个Excel表,合并到一个Excel中(每个Excel中不只一个sheet表);

③ 将一个Excel表中的多个sheet表合并,并保存到同一个excel;

④ 将一个Excel表,按某一列拆分成多张表;

二、知识点讲解


其实完成这些操作,涉及到了太多的知识点,因此在讲述上述这个知识点以前,我们要带大家复习一些常用的知识点。


① os模块常用知识点讲解;

② pandas模块常用知识点讲解;

③ xlsxwriter模块常用知识点讲解;

④ xlrd常用知识点讲解;

1. os模块知识点讲解

对于os模块,我们主要讲述os.walk()、os.path.join()等知识点。


1.1 os.walk()

对于这个知识点,我们需要说明以下几点:


os.walk()的返回值是一个生成器(generator),我们需要循环遍历它,来获取其中的内容;

每次遍历,返回的都是一个三元组(path, dirs, files);

path:返回的是当前正在遍历的这个文件夹的,本身路径地址;

dirs:返回的是该文件夹中所有目录的名字(不包含子目录),有多少个都以“列表”返回;

files:返回的是该文件夹中所有的文件(不包含子目录下的文件),有多少个都以“列表”返回;

如果说,有一个如图所示的文件夹。

image.png

利用下方的代码,我们可以得到什么结果呢?


pwd = "G:\\a"
print(os.walk(pwd))
for i in os.walk(pwd):
    print(i)
for path,dirs,files in os.walk(pwd):
    print(files)```


结果如下:


<generator object walk at 0x0000029BB5AEAB88>
('G:\\a', [], ['aa.txt', 'bb.xlsx', 'cc.txt', 'dd.docx'])
['aa.txt', 'bb.xlsx', 'cc.txt', 'dd.docx']


1.2 os.path.join()

这个函数,主要用于将多个路径组合后返回,超级简单,就不做过多阐述。


path1 = 'G:\\a'
path2 = 'aa.txt'
print(os.path.join(path1,path2))


结果如下:


G:\a\aa.txt


2. pandas模块知识点讲解

由于是需要利用Pandas进行Excel的合并,因此我们要学会,如何利用Pandas进行数据的纵向合并。


我们先创建2个数据框(DataFrame):


import numpy as np
xx = np.arange(15).reshape(5,3)
yy = np.arange(1,16).reshape(5,3)
xx = pd.DataFrame(xx,columns=["语文","数学","外语"])
yy = pd.DataFrame(yy,columns=["语文","数学","外语"])
print(xx)
print(yy)


效果如下:

image.png

接着,可以利用Pandas中的concat()函数,完成纵向拼接的操作。


pd.concat(list)中【默认axis=0】默认的是数据的纵向合并;

pd.concat(list)括号中传入的是一个列表;

ignore_list=True表示忽略原有索引,重新生成一组新的索引;

或者直接可以写成z = pd.concat([xx,yy],ignore_list=True);

concat_list = []
concat_list.append(xx)
concat_list.append(yy)
z = pd.concat(concat_list,ignore_list=True)
print(z)


效果如下:image.png


相关文章
|
10月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
1792 10
|
5月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据分析,别再死磕Excel了!
Python数据分析,别再死磕Excel了!
216 2
|
10月前
|
Python
按条件将Excel文件拆分到不同的工作表
使用Python的pandas库,可以轻松将Excel文件按条件拆分到不同的工作表中。本文通过一个示例代码展示了如何生成一个包含总成绩表和三个班级表的Excel文件。代码首先创建了一个包含学生姓名、班级和各科成绩的数据框,然后按班级分组,将每个班级的数据分别写入不同的工作表。最后,生成的Excel文件将包含四个工作表,分别为总成绩表和三个班级的成绩表。
175 6
按条件将Excel文件拆分到不同的工作表
|
8月前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
本书介绍了如何将Python与Excel结合使用,以提升数据分析和处理效率。内容涵盖Python入门、pandas库的使用、通过Python包操作Excel文件以及使用xlwings对Excel进行编程。书中详细讲解了Anaconda、Visual Studio Code和Jupyter笔记本等开发工具,并探讨了NumPy、DataFrame和Series等数据结构的应用。此外,还介绍了多个Python包(如OpenPyXL、XlsxWriter等)用于在无需安装Excel的情况下读写Excel文件,帮助用户实现自动化任务和数据处理。
|
9月前
|
数据可视化 数据挖掘 大数据
1.1 学习Python操作Excel的必要性
学习Python操作Excel在当今数据驱动的商业环境中至关重要。Python能处理大规模数据集,突破Excel行数限制;提供丰富的库实现复杂数据分析和自动化任务,显著提高效率。掌握这项技能不仅能提升个人能力,还能为企业带来价值,减少人为错误,提高决策效率。推荐从基础语法、Excel操作库开始学习,逐步进阶到数据可视化和自动化报表系统。通过实际项目巩固知识,关注新技术,为职业发展奠定坚实基础。
|
11月前
|
Java 测试技术 持续交付
【入门思路】基于Python+Unittest+Appium+Excel+BeautifulReport的App/移动端UI自动化测试框架搭建思路
本文重点讲解如何搭建App自动化测试框架的思路,而非完整源码。主要内容包括实现目的、框架设计、环境依赖和框架的主要组成部分。适用于初学者,旨在帮助其快速掌握App自动化测试的基本技能。文中详细介绍了从需求分析到技术栈选择,再到具体模块的封装与实现,包括登录、截图、日志、测试报告和邮件服务等。同时提供了运行效果的展示,便于理解和实践。
679 4
【入门思路】基于Python+Unittest+Appium+Excel+BeautifulReport的App/移动端UI自动化测试框架搭建思路
|
10月前
|
Python
按条件将Excel文件拆分到不同的工作表
使用Python的pandas库,可以轻松将Excel文件按条件拆分为多个工作表。本文通过一个具体示例,展示了如何根据学生班级将成绩数据拆分到不同的工作表中,并生成一个包含总成绩表和各班级成绩表的Excel文件。代码简洁明了,适合初学者学习和应用。
283 6
|
数据处理 Python
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
这篇文章介绍了如何使用Python读取Excel文件中的数据,处理后将其保存为txt、xlsx和csv格式的文件。
585 3
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
|
12月前
|
Python
python读写操作excel日志
主要是读写操作,创建表格
145 2
|
10月前
|
机器学习/深度学习 前端开发 数据处理
利用Python将Excel快速转换成HTML
本文介绍如何使用Python将Excel文件快速转换成HTML格式,以便在网页上展示或进行进一步的数据处理。通过pandas库,你可以轻松读取Excel文件并将其转换为HTML表格,最后保存为HTML文件。文中提供了详细的代码示例和注意事项,帮助你顺利完成这一任务。
459 0

热门文章

最新文章

推荐镜像

更多