83行代码

简介: #!/usr/bin/env python #-*-coding:utf-8-*- #****************************************************************************** #****************Descripti.


使用SARIMAX进行时间序列预测。


#!/usr/bin/env python
#-*-coding:utf-8-*-

#******************************************************************************
#****************Description:Time Series prediction using SARIMAX
#****************Author:Duan Tingyin
#****************Date:2018.02.14
#**************************************************

import pandas as pd
import matplotlib.pyplot as plt
import datetime
from statsmodels.tsa.api  import SARIMAX

datapath = '../data/'
train_df = pd.read_csv(datapath+'[new] yancheng_train_20171226.csv')
testA_df = pd.read_csv(datapath+'yancheng_testA_20171225.csv')
testB_df = pd.read_csv(datapath+'yancheng_testB_20180224.csv')


train_class = train_df.groupby(['sale_date','class_id'])['sale_quantity'].sum().to_frame().reset_index()
train_class.head()


def plt_class(data,x,y,class_id):
    this_class_id=data[data.class_id == class_id]
    plt.scatter(x=this_class_id[x],y=this_class_id[y])


def trans_date(x):
    str_x=str(x)
    year=int(str_x[:4])
    month=int(str_x[4:])
    return datetime.date(year,month,1)


train_class['_sale_date']=train_class['sale_date'].apply(trans_date)
testA_df['_sale_date']=testA_df['predict_date'].apply(trans_date)
testB_df['_sale_date']=testB_df['predict_date'].apply(trans_date)
#print(train_class.head(),testA_df.head(),testB_df.head())


s="predict_date,class_id,predict_quantity"
ex=[]
f=open("../data/yancheng_testA_20171225.csv","r")
for line in f.readlines():

    if "date" in line:
       continue

    class_id=int(line.split(",")[1])
    this_class_id=train_class[train_class['class_id']==class_id][['_sale_date','sale_quantity']]
    if class_id==653436:
        print(this_class_id._sale_date)
    #indexed_this_class_id = this_class_id.set_index(this_class_id['_sale_date'])
    indexed_this_class_id=this_class_id.set_index(pd.date_range(end='2017-11',periods=len(this_class_id['_sale_date']),freq='M'))
    print(this_class_id['_sale_date'],pd.date_range(end='2017-11',periods=len(this_class_id['_sale_date']),freq='M'))

    res=0
    try:
        fit1=SARIMAX(indexed_this_class_id.sale_quantity,verbose=False).fit()
        pre=fit1.get_forecast().conf_int()
        res=(int(round((pre['lower sale_quantity'] + pre['upper sale_quantity'])*0.5)))
    except Exception as e:
        print(e)
        ex.append(class_id)
        plt_class(train_class,'sale_date','sale_quantity',class_id)
        res=int(this_class_id['sale_quantity'].iloc[-1])
        this_class_id.to_csv('EXCEPTION'+str(class_id) +".csv",header=True,index=False,float_format='%.0f')

    s+="\n"
    s+="201711"+ ","+str(class_id) + "," +str(res)
f.close()

s+="\n"
train_class[['sale_date','class_id','sale_quantity']].to_csv('train_class.csv',header=True,index=False,float_format='%.0f')

fw=open("201711.csv","w")
fw.write(s)
fw.close()


print(ex)

目录
相关文章
|
3月前
|
机器学习/深度学习 自然语言处理 算法
代码的前世今生详细介绍
7月更文挑战第8天
54 4
|
6月前
|
Java 测试技术 开发工具
写代码中的一些“小技巧”
写代码中的一些“小技巧”
|
6月前
|
设计模式 IDE Java
如何将代码写的更加优雅?
如何将代码写的更加优雅?
56 0
|
存储 安全 Java
写出漂亮代码的45个小技巧(下)
大家好,我是三友~~ 不知道大家有没有经历过维护一个已经离职的人的代码的痛苦,一个方法写老长,还有很多的if else ,根本无法阅读,更不知道代码背后的含义,最重要的是没有人可以问,此时只能心里默默地问候这个留坑的兄弟。。
写出漂亮代码的45个小技巧(下)
|
6月前
你写过的最蠢的代码是?
你写过的最蠢的代码是?
35 0
|
Java Android开发
几行代码就能实现为何要多此一举
几行代码就能搞定,不能代表一个人很牛,借助了开源,只是站在了巨人的肩膀上,让你省去了去往成功的一大段路,然而这一段路上的风景,还请你仔细去欣赏,到头来,你会发现,路上的风景会远远美于终点的成功。
|
Java Python
长见识,让大家看看什么是垃圾代码
长见识,让大家看看什么是垃圾代码
109 0
|
定位技术 数据处理 开发工具
如何优雅地统计代码(一)
*精美排版详见钉钉文档其实这个事情要从一个下午讲起,对我来说是个尤里卡时刻;其实一开始让我直接从数据里统计大家提交代码是有点无从下手的,前几天开始调研了一波代码统计方案后发现大部分都是基于文件来统计代码的各种行数并没有这种基于前后版本的变更代码统计,大家更多的使用Git自带的统计方法但显然我这里没有这样的环境(下面背景会详细展开),快要放弃今天的技术调研遂下楼散步刷新思维,我又回溯了我在这个项目中
|
存储 分布式计算 并行计算
聊聊什么代码是好代码
聊聊什么代码是好代码
最近特火的爱心代码来了
最近因为一部《点燃我温暖你》的电视剧而爆火的爱心代码不会还有人不会制作吧。
最近特火的爱心代码来了