Pandas 合并多个 (300多个) Excel 文件,并输出为 CSV 文件

简介: Pandas 合并多个 (300多个) Excel 文件,并输出为 CSV 文件

Pandas 合并多个 (300多个) Excel 文件,并输出为 CSV 文件


爬虫同事帮忙爬了个网站信息,网站上有300多页,每页生成一个 Excel 文件,为方便处理,我需要合并成一个 all.csv 文件。

不废话,上代码:

import pandas as pd
import os
def process_data():
    folder_path = r'/Users/example'         
     # 要拼接的文件夹及其完整路径,注意不要包含中文
    saveFile_path =  r'/Users/example/'       #拼接后要保存的文件路径
    saveFile_name = r'all.csv'                #合并后要保存的文件名
    # 修改当前工作目录
    os.chdir(folder_path)
    # 将该文件夹下的所有文件名存入一个列表
    file_list = os.listdir()
    # print(file_list)
    # 读取第一个CSV文件并包含表头,默认编码方式为 UTF-8
    df = pd.read_excel(folder_path + '/'+ file_list[0])   
    print(df)
    # 将读取的第一个 CSV 文件写入合并后的文件保存
    df.to_csv(saveFile_path + saveFile_name,index=False)
    # 遍历列表中所有 CSV 并追加到合并文件的末尾
    for i in range(1,len(file_list)):
        print(folder_path + '/'+  file_list[i])
        # 如果是以下两个文件,则跳过
        if file_list[i] == 'all.csv' or file_list[i] == '.DS_Store':
            pass
        else:
            # 不包含表头
            df = pd.read_excel(folder_path + '/'+  file_list[i], header = 1)
            df.to_csv(saveFile_path + saveFile_name,index=False, header=False, mode='a+')
if __name__ == '__main__':
    process_data()

代码思想有借鉴 https://blog.csdn.net/kxw1994/article/details/76465152 中的方法,特此感谢。

以上,问题解决~

相关文章
|
2月前
|
存储 数据挖掘 Java
csv和excel
【10月更文挑战第18天】csv和excel
104 5
|
20天前
|
Python
按条件将Excel文件拆分到不同的工作表
使用Python的pandas库,可以轻松将Excel文件按条件拆分到不同的工作表中。本文通过一个示例代码展示了如何生成一个包含总成绩表和三个班级表的Excel文件。代码首先创建了一个包含学生姓名、班级和各科成绩的数据框,然后按班级分组,将每个班级的数据分别写入不同的工作表。最后,生成的Excel文件将包含四个工作表,分别为总成绩表和三个班级的成绩表。
27 6
按条件将Excel文件拆分到不同的工作表
|
20天前
|
数据可视化 数据处理 Python
使用Pandas实现Excel中的数据透视表功能
本文介绍了如何使用Python的Pandas库实现Excel中的数据透视表功能,包括环境准备、创建模拟销售数据、代码实现及输出等步骤。通过具体示例展示了按地区和销售员汇总销售额的不同方法,如求和、平均值、最大值等,帮助读者掌握Pandas在数据处理上的强大能力。
53 12
|
19天前
|
Python
批量将不同的工作簿合并到同一个Excel文件
本文介绍如何使用Python的`pandas`库批量合并不同工作簿至同一Excel文件。通过模拟生成三个班级的成绩数据,分别保存为Excel文件,再将这些文件合并成一个包含所有班级成绩的总成绩单。步骤包括安装必要库、生成数据、保存与合并工作簿。
26 6
|
19天前
|
Python
按条件将Excel文件拆分到不同的工作表
使用Python的pandas库,可以轻松将Excel文件按条件拆分为多个工作表。本文通过一个具体示例,展示了如何根据学生班级将成绩数据拆分到不同的工作表中,并生成一个包含总成绩表和各班级成绩表的Excel文件。代码简洁明了,适合初学者学习和应用。
32 6
|
27天前
|
前端开发
实现Excel文件和其他文件导出为压缩包,并导入
实现Excel文件和其他文件导出为压缩包,并导入
27 1
|
2月前
|
数据处理 Python
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
这篇文章介绍了如何使用Python读取Excel文件中的数据,处理后将其保存为txt、xlsx和csv格式的文件。
87 3
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
|
1月前
|
存储 Java API
Java实现导出多个excel表打包到zip文件中,供客户端另存为窗口下载
Java实现导出多个excel表打包到zip文件中,供客户端另存为窗口下载
55 4
|
2月前
|
JavaScript 前端开发 数据处理
Vue导出el-table表格为Excel文件的两种方式
Vue导出el-table表格为Excel文件的两种方式
95 6
|
2月前
|
easyexcel Java UED
SpringBoot中大量数据导出方案:使用EasyExcel并行导出多个excel文件并压缩zip后下载
在SpringBoot环境中,为了优化大量数据的Excel导出体验,可采用异步方式处理。具体做法是将数据拆分后利用`CompletableFuture`与`ThreadPoolTaskExecutor`并行导出,并使用EasyExcel生成多个Excel文件,最终将其压缩成ZIP文件供下载。此方案提升了导出效率,改善了用户体验。代码示例展示了如何实现这一过程,包括多线程处理、模板导出及资源清理等关键步骤。