当时在看了题目,并用Python把云图画出来之后,我觉得这个应该用卷积神经网络来做,可以先按照图像处理一下。可是我只有一个破笔记本,没有什么GPU,看了一下数据量感觉别说跑不了神经网络,就算是跑一般的机器学习算法也要热的死机。本来想放弃来着,后来转念一想何不自我挑战一下用传统的机器学习来做一下这道题。正好我当时还有一个1C2G的ECS(半年试用送的),我决定就是它了。于是在这个虚机上装了Python环境,在上面跑各种算法,很长一段时间这个虚机的CPU一直是100%。在这里怀念一下那个小ECS,自从到了我的手里,它真的是饱受摧残,资源100%是常有的事,搞蹦重做也是常有的事。
我提取了包括时序,和每张云图的各种特征,跑了GBDT,RF,XGB,SVM,Arima等各种算法(当然每次数据量不能太大,否则ECS也会报错),并进行了融合。也看了一些使用机器学习预测降雨量的论文及Python关于天气的一些包和算法,不过这些很多需要风,前期降雨量等一些我没有的数据,所以也没有怎么用。做了几天成绩做到14.15,后续就不动了,我感觉传统算法差不多也就这个样了,也就不再做了。
后记,昨天看了冠军队伍的讲解,感觉十分的佩服,他们把对物理原理及数据分析结合的非常好。他们没有完全用图像分析,他们的很多思路我都没有想到,我想对于这道题我即使有一个好的机器也绝不是他们的对手。