###套利分析 import pandas as pd import numpy as np #读取数据 caipo=pd.read_excel('caipo.xlsx') doupo=pd.read_excel('doupo.xlsx') caipo.head(5) #整理数据 caipo_close=caipo.ix[::,6] caipo_close.head() doupo_close=doupo.ix[::,6] doupo_close.head() '''#分析数据 cc=caipo_close dc=doupo_close cc.mean() dc.mean() i=dc.mean()/cc.mean() i e=cc*i-dc e.head() #基于均值比例分析残差 e.plot()'''
#发现基于均值比例的模型随机性太强,我们基于相关系数重新计算 cc=caipo_close dc=doupo_close cc.corr(dc,method='pearson') #从相关系数来看,两者的相关性很高,94%; #菜粕和豆粕价格相差很大,我们不同比例计算 ccnew=cc*123 dcnew=dc*100 e=(ccnew-dcnew)/100 e.head(10) e.plot()