【干货】Kaggle 数据挖掘比赛经验分享(mark 专业的数据建模过程)
简介
Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台。笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛,相继获得了 CrowdFlower 搜索相关性比赛第一名(1326支队伍)和 HomeDepot 商品搜索相关性比赛第三名(2125支队伍),曾在 Kaggle 数据科学家排行榜排名全球第十
CNN与图像语义分割
级别1:DL快速上手
级别2:从Caffe着手实践
级别3:读paper,网络Train起来
级别4:Demo跑起来
读一些源码玩玩
熟悉Caffe接口,写Demo这是硬功夫
分析各层Layer输出特征
级别5:何不自己搭个CNN玩玩
Train
CNN时关于数据集的一些注意事项
级别6:加速吧,GPU编程
关于语义分割的一些其它工作
说好的要笔耕不缀,这开始一边实习一边找工作,还摊上了自己的一点私事困扰,这几个月的东西都没来得及总结一下。
Caffe深度学习计算框架
Caffe | Deep Learning Framework是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的 Yangqing Jia,目前在Google工作。Caffe是纯粹的C++/CUDA架构,支持命令行、Python和MATLAB接口;可以在CPU和GPU直接无缝切换:
1 Caffe::set_mode(Caffe::GPU);
Caffe的优势
上手快:模型与相应优化都是以文本形式而非代码形式给出。