pandas 写入excel数据
在使用pandas之前,需要安装pandas模块,
老方法:
pip install pandas
安装完成后,就可以直接使用了,
上代码
# -*- coding:utf-8 -*- """ @ auth : carl_DJ @ time : 2020-8-13 """ import pandas as pd import os #DataFrame 数据帧,相当于工作簿中的一个工作表 df = pd.DataFrame({ 'id':[1,2,3,4], 'name':['张三','李四','王五','赵刘'], 'arg': [10,20,30,40], 'score':[99,88,77,66] }) #自定义索引,否则pandas会使用默认索引,导致工作表也会存在这些索引 cf = df.set_index('id') # print(cf) #设置文件保存路径 data_path = "../py_class/data" #没有,则创建 if not os.path.exists(data_path): os.mkdir(data_path) #设置文件名,以xlsx格式 data_name = os.path.join(data_path,'data.xlsx') #把DataFrame的数据写入excel表 cf.to_excel(data_name) print("done")
最后执行完成,
使用id做索引,结果长这样:
使用pandas默认索引,结果是酱样子的:
所以,要使用pandas默认索引还是 自己创建索引,看各个的喜欢~~
pandas 读取excel数据
读取excel的数据,也很简单,
咱先把各种情况,列举一下,然后在读取数据
#设置文件名字,没用os.path方法,因为这不是重点 data_name= '../py_class/data/data.xlsx' #header=2表示从第三行开始(默认0),跳过前两行,sheet_name表示工作表名称 pepl = pd.read_excel(data_name,header=2,sheet_name="Sheet1") # pepl = pd.read_excel(data_name,sheet_name="Sheet1") #打印列名 # print(pepl.columns) #sort_values 进行排序,by 针对某一行,ascending= False 表示从大到小,inplace = True 直接编辑当前的文档 pepl.sort_values(by = "score", ascending= False, inplace=True) print(pepl) #如果读取的excel中无开头标题,可将header=None,手动进行设置 pepl = pd.read_excel(data_name,header=None) #设置 4个字段,id,name,arg,score pepl.columns = ['id','name','arg','score'] print(pepl.columns) #指定id列为索引 pepl = pd.read_excel(data_name,index_col = 'id') #输出,此时就不会产生索引 print(pepl.head()) #skiprows开头跳过几行,usecols使用哪些列中的数据,dtype设置某一列的类型 pepl = pd.read_excel(data_name,skiprows = 4,usecols = 'E:H',dtype={"id":str,"gender":str,"brithday":str})
下面 我们就是演示一下,看看我们上面写的数据,输入情况如何
# -*- coding:utf-8 -*- """ @ auth : carl_DJ @ time : 2020-8-13 """ import pandas as pd #设置文件名字 data_name= '../py_class/data/data.xlsx' #读取data_name文件,sheet页是sheet1 peple = pd.read_excel(data_name,sheet_name="Sheet1") #print(peple.head()) #sort_values 进行排序,by 针对sorce,ascending= False 表示从大到小,inplace = True 就地编辑 peple.sort_values(by = "score", ascending= False, inplace=True) # print(peple)
输出的结果,就酱样: