我的天池比赛经验

简介:

我17年开始参加天池大赛,玩天池一半是为了练习机器学习,一半是消遣。因为工作、家庭的事情都很多,时间很难保证,为了不坑队友,所以到现在比赛都是SOLO,自娱自乐。因为可用时间少,又是一个人SOLO,所以闭门造车、走到沟里出不来也都是常有的事。

第一个比赛是IJCAI-17 口碑商家客流量预测,那个时候刚好看了时序的一些东西,觉得R语言的Auto.Arima很不错,于是就把R语言关于时序的包都调了一个遍,然后又是一顿乱七八糟的融合。我的笔记本配置不好,跑Arima温度都高的不行,正好我当时还有一个1C2G的ECS(半年试用送的),我决定就是它了。于是在这个虚机上装了R和Python的环境,在上面跑各种算法,很长一段时间这个虚机的CPU一直是100%。而且这个比赛,因为一直没有走到正路上,所以结果也就毫无悬念的扑街了。

第二个比赛是阿里聚安全算法挑战赛,因为是平台赛,不用自己的计算资源,而且主要的处理界面都是跑的SQL,所以玩的十分快乐,最后总成绩35名。

第三个好像是CIKM,当时在看了题目,并用Python把云图画出来之后,我觉得这个应该用卷积神经网络来做,可以先按照图像处理一下。可是我只有一个破笔记本,没有什么GPU,只好用传统算法一顿瞎做,又扑街了。

然后因为比较忙,所以后面的几个比赛都是打酱油了,基本上都是扔了一个成绩就走的。

2018年初参加了阿里聚安全算法挑战赛,具体解题思路,可以看一下我的这个帖子: https://tianchi.aliyun.com/forum/new_articleDetail.html?from=user&raceId=&postsId=3062 可能是因为题目比较适合我吧,经过初赛,复赛,24小时决赛,最后得了一个季军(三等奖),这是我第一次得奖,当时非常高兴。

感觉像是捅破了窗户纸,后续参加的比赛就开始陆续得奖了,在后续的比赛中得过3个亚军,2个季军,几个top5,现在在40万天池选手中积分排第9。

我其实每个比赛投入的精力都比较有限,对如何用非常有限的时间和精力取得较好成绩,我有一些不算是经验的经验吧,放在这算是抛砖引玉吧。

1,理解业务、数据,科学的数据可视化处理对于理解数据有很大的帮助。

2,抓住要点,建立基线,快速迭代。再复杂的问题总有一些简单的处理方法,先把它做出来,投石问路。

3,查找资料,借鉴前人经验。

4,做好规划,合理安排时间,长短期结合,多种方案、模型并行

5,前期要脑洞大开,多多尝试。后期要精细打磨,精益求精。

6,整理文档,做好记录,磨刀不误砍柴工,做好总结,不断提升。

7,在总结之外还有分享,交流,分享、交流在帮助别人的同时也可以让自己更快、更加深入的掌握这项技术。

8,最后是由一个好的心态,成绩不论如何,自己有学到新东西,自己开心就好。

相关文章
|
容器
SD-AI绘画云端部署教程
在 AutoDL上安装 Stable Diffusion,就可以在云端运行程序。这不仅可以帮你提高计算速度,还可以节省大量的时间和金钱
2536 0
|
存储 Oracle Java
分代 ZGC 详解
本文主要介绍JDK21中的分代ZGC详解,包括染色指针、内存屏障等核心概念及ZGC JVM参数介绍 ZGC(Z Garbage Collector)是Java平台上的一种垃圾收集器,它是由Oracle开发的,旨在解决大堆的低延迟垃圾收集问题。ZGC是一种并发的分代垃圾收集器,它主要针对具有大内存需求和低停顿时间要求的应用程序。
分代 ZGC 详解
|
网络协议 算法 安全
TCP/UDP 数据传输的链路解析
TCP/UDP 数据传输的链路解析
366 0
|
人工智能 文字识别 达摩院
阿里云文字识别(OCR)服务 Quick Start
阿里云文字识别(Optical Character Recognition,OCR)可以将图片中的文字信息转换为可编辑文本,是一款由阿里巴巴达摩院权威AI团队打造的全栈全场景OCR文本识别类产品。根据客户的业务场景和需求,将产品分为了通用文字识别、个人证照识别、票据凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种文字识别等,满足各种客户的图片识别需求。 由于阿里云视觉智能开放平台和云市场这两个渠道下也具备阿里文字识别服务,一些不熟悉的客户很容易将三者搞混淆,这边简单做下对比。然后再针对个人证照识别下常见的服务-身份证识别功能简单介绍下产品的开通及使用。
8181 0
阿里云文字识别(OCR)服务 Quick Start
|
10月前
|
人工智能 搜索推荐 大数据
2025年电商API发展趋势:智能化与个性化
2025年,电商API在人工智能与大数据推动下加速智能化、个性化发展。从智能库存预警到情境感知推荐,技术驱动效率跃升与体验升级。预计个性化API调用占比达75%,智能决策渗透率超90%,开发成本下降60%。电商API正从“功能连接器”进化为“智能服务中枢”,重构用户体验与商业生态。
293 0
|
机器学习/深度学习 人工智能 Cloud Native
2024阿里云天池大学生竞赛正式开赛,全网招募高校最强大脑!
2024阿里云天池大学生竞赛正式开赛,全网招募高校最强大脑!
|
11月前
|
存储 安全 Java
2025 年最新 40 个 Java 基础核心知识点全面梳理一文掌握 Java 基础关键概念
本文系统梳理了Java编程的40个核心知识点,涵盖基础语法、面向对象、集合框架、异常处理、多线程、IO流、反射机制等关键领域。重点包括:JVM运行原理、基本数据类型、封装/继承/多态三大特性、集合类对比(ArrayList vs LinkedList、HashMap vs TreeMap)、异常分类及处理方式、线程创建与同步机制、IO流体系结构以及反射的应用场景。这些基础知识是Java开发的根基,掌握后能为后续框架学习和项目开发奠定坚实基础。文中还提供了代码资源获取方式,方便读者进一步实践学习。
2598 2
|
人工智能 算法 大数据
【天池大赛】历届比赛资料
【天池大赛】历届比赛资料
|
Python Windows
xlrd库报错【AttributeError: ‘ElementTree‘ object has no attribute ‘getiterator‘】
xlrd库报错【AttributeError: ‘ElementTree‘ object has no attribute ‘getiterator‘】
623 0
|
Go API 数据库
Go 语言中常用的 ORM 框架,如 GORM、XORM 和 BeeORM,分析了它们的特点、优势及不足,并从功能特性、性能表现、易用性和社区活跃度等方面进行了比较,旨在帮助开发者根据项目需求选择合适的 ORM 框架。
本文介绍了 Go 语言中常用的 ORM 框架,如 GORM、XORM 和 BeeORM,分析了它们的特点、优势及不足,并从功能特性、性能表现、易用性和社区活跃度等方面进行了比较,旨在帮助开发者根据项目需求选择合适的 ORM 框架。
1547 4