大家好,我是drop-out。目前在IJCAI-17口碑客流量预测大赛中排名第七。由于冲击前三已经没有希望,我们将我们这次比赛中使用的模型进行了简单的封装,现在开源给大家,希望能对大家有帮助。
这次我们使用了改进版本的KNN。传统KNN取最近邻的均值作为预测。在损失函数为MSE时,均值确实是能使MSE最小的点估计。而这次口碑客流量预测中,损失函数并不是MSE。这次比赛的评分函数实际上称为SMAPE(维基百科:SMAPE)。我们改写的KNN在最近邻中进行grid research,以寻找能最小化SMAPE的点估计。
模型的代码在这里: github: NonparametricKNN 。
时间序列问题,我们唯一能做的就是从历史中寻找相似的模式,用相似模式的历史值作为预测。这也是使用KNN的逻辑。而这里用改写的KNN,可以得到最小化SMAPE的预测值。
-------------------------
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。