暂无个人介绍
工业界的推荐系统非常庞大复杂,搭建一个toy来进行学习和研究并不是一个好的方式,建议从某些基础算法入手,比如手动实现各种CF算法,了解背后的原理与使用场景
写一个打散函数,尽量按照网站进行打散
Hadoop MapReduce是一整套生态, 就算使用Spark也离不开HBase,Hive,Pig,Impala 或其他 Hadoop 项目。建议两者共同使用
语言只是工具,每个建议花一周左右的时间,短期快速高效的了解,知道每个语言大概是语法、特性与使用情景,然后就是持续不断的大量练习了
建议学习路线:
python的简明语法
numpy数学计算
scikit-learn科学计算
matplotlib画图
阿里的机器学习平台也比较多,可以说各家争鸣,各种代码形式的都存在。
想快速学习技术,我不建议马上参与,先学习,建议从阅读JUnit不错开始,它非常不错
使用python的Django框架搭建服务器,Django框架是一个轻量级的服务框架,非常的简单易用,从这里学习开发起吧https://www.djangoproject.com/