大数据基础环境学习:
因为大数据相关技术很多,就说一下我自己的学习过程吧,希望能给大家一些帮助。我一开始是自己感兴趣看了一些文章,也在本机用虚机搭了个环境自己自娱自乐,主要是用的CDH,把相关功能都用了一遍,有了第一印象。后来又参与了一个大数据项目的实施工作,有了实践经验,又把相关论文都重看了一遍,感觉自己算是入了门。后来有看了很多阿里云的资料,参加阿里云的培训,通过学习飞天里面的各部分技术,比如盘古,伏羲,女娲等,感觉对于大数据技术又是一次互相印证。
我刚才看了一下,这部分的视频,阿里云栖社区上还能找到,就是在阿里云大学的云计算学习路线图:
https://edu.aliyun.com/promotion/28?spm=5176.8764702.aliyun-edu-developer-banner.2.ibTeJX
的最后一部分:技术深入。这里面把大数据平台也是云平台里面最关键的几个技术都进行了深入浅出的说明,建议初学者去听一下。包括:
分布式调度系统(6课时)
分布式存储系统(15课时)
分布式数据库(7课时)
分布式计算(9课时)
分布式系统应用架构(9课时)
算法学习:
现在机器学习及深度学习算法的资料很多,我看的部分内容包括:
书:李航的《数理统计》,周志华的《机器学习》,《机器学习实践应用》都不错。还有《R in action》, 《利用Python进行数据分析》等等也都还可以。
网上资料:可以在阿里云栖社区上有无数的资料,可以看网易公开课上看吴恩达的《机器学习》,斯坦福的那几门课程,GITHUB上看大神参加各个比赛的代码。
可以说现在互联网时代,资料是十分丰富的。不过我觉得要想真正掌握算法和技术,还是要多进行实践。要是现在工作中没有实际的应用可以做,参加大数据比赛也是一个不错的办法。我从今年初开始学习机器学习,一边学习一边参加天池比赛进行练习,整体效果还不错,自己感觉进步很快。