按列从多个文件中构建
假设有两个csv文件,列不相同,需要整合为一个dataframe,使用glob模块:
from glob import glob import pandas as pd # glob会返回任意排序的文件名,所以需要sort排序 some_files = sorted(glob('./some*.csv')) pd.concat((pd.read_csv(file) for file in some_files),axis='columns').head()
按行从多个文件中构建
比如有三天的股票数据,文件名都是stocks开头的csv文件,维度相同。需要将每个CSV文件读取成DataFrame,将它们结合成一个DataFrame。
from glob import glob import pandas as pd # glob会返回任意排序的文件名,所以需要sort排序 some_files = sorted(glob('./stocks*.csv')) pd.concat((pd.read_csv(file) for file in stock_files), ignore_index = True)