问我大数据怎么入门,我总结了亲身体验的学习路线推荐给她【推荐收藏】

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 问我大数据怎么入门,我总结了亲身体验的学习路线推荐给她【推荐收藏】

前言

大家好,我是程序员Manor,我希望自己能成为国家复兴道路的铺路人,大数据领域的耕耘者,平凡但不甘于平庸的人。

前两天有学妹私信我说,她已经上完大一,大数据专业的,只学过大数据导论,问我大数据该如何入门?我不禁感慨普通高校擅长培养算法人才,但在工程人才的培养上存在很多的问题。

恰好期末考完,在等待回家这段有时间,manor为大家整理了一份我学大数据学习路线,在B站均能找到视频:

学习路线思维导图:

第一部分大数据技术(离线)

0.快速体验大数据:8天零基础入门大数据

这段课程我是疫情在家学习的,当时黑马线上基础班免费,当时就报名(白嫖 ),能从0开始学习大数据课程,了解linux、kettle、BI、mysql、从基础到实践,快速体验完整的大数据预处理+ETL+BI展示全链路过程

缺点是B站上没有给到配套资料,这里安利一下我的公众号:大数据智能ai

基础班的配套资料虚拟机已经更新到公众号了,关注后自行获取即可。

1.掌握一门语言,首选Java

大数据开发有三种语言可选,Java,Python和Scala,Scala后期是必学的,Java在开发中好比是屠龙刀,而Python是随身匕首,适合写写脚本,所以强烈推荐先学Java,这里推荐黑马的Java基础课程视频,

黑马最新JavaSE零基础入门到入土(idea版)

如果学习周期太长的话,只要能完成控制台上的增删改查就可以了

B站上还有其他视频

例如:

动力节点的JavaSE课程:缺点是用Eclipse讲的

狂神的SE入门课程:优点:学习编程的一些前置知识,相当贴近实战。

2.hadoop零基础学习(HDFS、MapReduce、Yarn、Hive)

Hadoop学习,黑马和尚硅谷两家机构都不错,我这里由于自学的时候主要学了黑马的,便贴出黑马的链接

Hadoop从零到精通完整版

尚硅谷(更多人的选择):

【尚硅谷】Hadoop2.x框架入门教程丨案例实战,好评如潮

前置知识还要学习Linux,manor为大家准备好了Linux最全学习笔记:

大数据开发工程师基本功修炼之史上最全Linux学习笔记

另外学有余力,还想进一步提升可学:

新出的hadoop3*0

Hadoop3.0-MapReduce从入门到精通

尚硅谷讲的最新Hive版本

3.Hive离线数仓项目

这里推荐的是黑马的离线项目:

黑马大数据项目——电商流量分析项目实战

缺点是不给配套资料

尚硅谷的离线数仓

尚硅谷的配套资料全,学的人也多

我个人学的是另一个项目,在线教育数仓项目

由于特殊原因视频无法分享,各位可看我写的笔记,自行研究一番

补充:其他的小组件如zookeeper、Flume、Impala和sqoop等建议花2~3个小时自学

这些组件都是工作中不经常用的,建议只花少量的时间学习,快速入门即可

这里贴出部分视频

sqoop

Flume

Azkaban

到此为止,大数据离线阶段就学完了,完结撒花🎉·🎉·

我们进入到第二部分大数据离线+实时技术阶段~

第二部分大数据技术(离线+实时)

0.海量数据存储HBase从入门到精通

Hbase公司用的很多,Kudu与其相似

1.消息队列Kafka从入门到精通

大数据必须掌握的缓存中间件

2.大数据-语言-scala

同样是搞大数据开发必学的语言,原因是Spark是基础scala开发的

3.大数据-框架-Spark

4.Spark离线实时项目

学完Spark后,可做一个项目实战检验一下学习成果。

5.大数据-框架-Flink

进阶:

FlinkSQL

Flink源码解析课程

6.Flink实时项目

这也是我将要学的Flink项目,暑假必拿下~

进阶:

推荐系统项目

机器学习的书籍:稍后为各位整理出来,在我的公众号领取

可适当阅读一些数仓书籍,有益于理论深化

如:

《阿里巴巴的大数据之路》

《数据仓库工具箱—维度建模的完全指南》

❤️往期精彩回顾❤️:

「机器学习」推荐系统简介——一起来看看你是怎么被大数据杀熟的(四)

❤️大数据开发必备:推荐7款大数据开发神器工作效率提升1000%【推荐收藏】

学了1年大数据,来测测你大数据技术掌握程度?大数据综合复习之面试题15问(思维导图+问答库)

滴滴出行大数据数仓实战

手把手教你完成第一个JS项目:用简单到极致的贪吃蛇游戏熟悉JS语法

总结

到这里恭喜你把大数据的主流技术学完了,如果你还有什么不懂,可随时问我,私信我,如果C站没有回复你,可在公众号后台加我好友,备注:C站来的。

希望以上能够帮到刚入门大数据的你!


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
4月前
|
SQL 存储 分布式计算
ODPS开发大全:入门篇(3)
ODPS开发大全:入门篇
186 19
|
4月前
|
SQL 存储 分布式计算
ODPS开发大全:入门篇(1)
ODPS开发大全:入门篇
450 14
|
5月前
|
分布式计算 Hadoop 分布式数据库
Hadoop生态系统介绍(二)大数据技术Hadoop入门理论系列之一----hadoop生态圈介绍
Hadoop生态系统介绍(二)大数据技术Hadoop入门理论系列之一----hadoop生态圈介绍
168 2
|
3月前
|
分布式计算 资源调度 Hadoop
Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!
Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!
|
3月前
|
SQL 存储 分布式计算
MaxCompute 入门:大数据处理的第一步
【8月更文第31天】在当今数字化转型的时代,企业和组织每天都在产生大量的数据。有效地管理和分析这些数据变得至关重要。阿里云的 MaxCompute(原名 ODPS)是一个用于处理海量数据的大规模分布式计算服务。它提供了强大的存储能力以及丰富的数据处理功能,让开发者能够快速构建数据仓库、实时报表系统、数据挖掘等应用。本文将介绍 MaxCompute 的基本概念、架构,并演示如何开始使用这一大数据处理平台。
530 0
|
4月前
|
SQL 分布式计算 MaxCompute
ODPS开发大全:入门篇(2)
ODPS开发大全:入门篇
113 14
|
3月前
|
分布式计算 大数据 Java
Scala 入门指南:从零开始的大数据开发
Scala 入门指南:从零开始的大数据开发
|
4月前
|
存储 SQL 机器学习/深度学习
阿里云数加大数据计算服务MaxCompute学习路线图:从入门到精通
将所学知识应用于实际工作中并不断进行实践和创新是提升技术能力的关键所在。用户可以结合业务需求和技术发展趋势积极探索新的应用场景和解决方案,并在实践中不断总结经验和教训以提升自己的技术水平和实践能力。
|
4月前
|
分布式计算 大数据 Java
大数据开发语言Scala入门
大数据开发语言Scala入门
|
4月前
|
IDE 大数据 Java
「AIGC」大数据开发语言Scala入门
Scala,融合OOP和FP的多范式语言,在JVM上运行,常用于大数据处理,尤其与Apache Spark配合。要开始学习,安装Scala,选择IDE如IntelliJ。基础包括变量、数据类型、控制结构、函数。Scala支持类、对象、不可变数据结构、模式匹配和强大的并发工具。利用官方文档、教程、社区资源进行学习,并通过实践提升技能。
62 0