我17年开始参加天池大赛,玩天池一半是为了练习机器学习,一半是消遣。因为工作、家庭的事情都很多,时间很难保证,为了不坑队友,所以到现在比赛都是SOLO,自娱自乐。因为可用时间少,又是一个人SOLO,所以闭门造车、走到沟里出不来也都是常有的事。
第一个比赛是IJCAI-17 口碑商家客流量预测,那个时候刚好看了时序的一些东西,觉得R语言的Auto.Arima很不错,于是就把R语言关于时序的包都调了一个遍,然后又是一顿乱七八糟的融合。我的笔记本配置不好,跑Arima温度都高的不行,正好我当时还有一个1C2G的ECS(半年试用送的),我决定就是它了。于是在这个虚机上装了R和Python的环境,在上面跑各种算法,很长一段时间这个虚机的CPU一直是100%。而且这个比赛,因为一直没有走到正路上,所以结果也就毫无悬念的扑街了。
第二个比赛是阿里聚安全算法挑战赛,因为是平台赛,不用自己的计算资源,而且主要的处理界面都是跑的SQL,所以玩的十分快乐,最后总成绩35名。
第三个好像是CIKM,当时在看了题目,并用Python把云图画出来之后,我觉得这个应该用卷积神经网络来做,可以先按照图像处理一下。可是我只有一个破笔记本,没有什么GPU,只好用传统算法一顿瞎做,又扑街了。
然后因为比较忙,所以后面的几个比赛都是打酱油了,基本上都是扔了一个成绩就走的。
2018年初参加了阿里聚安全算法挑战赛,具体解题思路,可以看一下我的这个帖子: https://tianchi.aliyun.com/forum/new_articleDetail.html?from=user&raceId=&postsId=3062 可能是因为题目比较适合我吧,经过初赛,复赛,24小时决赛,最后得了一个季军(三等奖),这是我第一次得奖,当时非常高兴。
感觉像是捅破了窗户纸,后续参加的比赛就开始陆续得奖了,在后续的比赛中得过3个亚军,2个季军,几个top5,现在在40万天池选手中积分排第9。
我其实每个比赛投入的精力都比较有限,对如何用非常有限的时间和精力取得较好成绩,我有一些不算是经验的经验吧,放在这算是抛砖引玉吧。
1,理解业务、数据,科学的数据可视化处理对于理解数据有很大的帮助。
2,抓住要点,建立基线,快速迭代。再复杂的问题总有一些简单的处理方法,先把它做出来,投石问路。
3,查找资料,借鉴前人经验。
4,做好规划,合理安排时间,长短期结合,多种方案、模型并行
5,前期要脑洞大开,多多尝试。后期要精细打磨,精益求精。
6,整理文档,做好记录,磨刀不误砍柴工,做好总结,不断提升。
7,在总结之外还有分享,交流,分享、交流在帮助别人的同时也可以让自己更快、更加深入的掌握这项技术。
8,最后是由一个好的心态,成绩不论如何,自己有学到新东西,自己开心就好。