Spark Sreaming实战(一)-教程概述

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
大数据开发治理平台 DataWorks,不限时长
简介: Spark Sreaming实战(一)-教程概述

1  实战目标

  • 至今专栏的访问量
  • 至今从搜索引擎引流过来的专栏的访问量

2 实战流程

3 可视化显示

  • 使用Spring Boot整合Echarts
  • 阿里云DataV数据可视化框架

4 教程概要

  • 初识实时流处理
  • 日志收集框架Flume
  • 消息队列Kafka
  • 实战环境搭建
  • Spark Streaming入门
  • Spark Streaming进阶
  • Spark Streaming集成Kafka
  • Spark Streaming集成Flume

5 计划

  • 整合Flume、Kafka、 Spark Streaming打造通用的流处理平台基础
  • Spark Streaming项目实战
  • 数据处理结果可视化
  • 拓展

6 前提

  • 熟悉Linux基本命令
  • 熟悉Scala/Python/Java
  • 有Hadoop和Spark基础

7 环境

  • JDK : 1.8
  • Hadoop: CDH ( 5.7 )
  • Scala : 2.12
  • Spark: 2.4.1
目录
相关文章
|
5月前
|
SQL 分布式计算 Spark
Spark 教程系列
Spark 教程系列
28 0
|
2月前
|
分布式计算 并行计算 大数据
Spark学习---day02、Spark核心编程(RDD概述、RDD编程(创建、分区规则、转换算子、Action算子))(一)
Spark学习---day02、Spark核心编程 RDD概述、RDD编程(创建、分区规则、转换算子、Action算子))(一)
|
5月前
|
SQL 分布式计算 大数据
【大数据技术Spark】DStream编程操作讲解实战(图文解释 附源码)
【大数据技术Spark】DStream编程操作讲解实战(图文解释 附源码)
43 0
|
5月前
|
SQL 分布式计算 数据库
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
113 0
|
3月前
|
SQL 分布式计算 API
Spark学习------SparkSQL(概述、编程、数据的加载和保存)
Spark学习------SparkSQL(概述、编程、数据的加载和保存)
|
5月前
|
分布式计算 大数据 Scala
【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战(超详细 附源码)
【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战(超详细 附源码)
98 1
|
2月前
|
分布式计算 Java Scala
Spark学习---day03、Spark核心编程(RDD概述、RDD编程(创建、分区规则、转换算子、Action算子))(二)
Spark学习---day03、Spark核心编程(RDD概述、RDD编程(创建、分区规则、转换算子、Action算子))(二)
|
9天前
|
SQL 分布式计算 Hadoop
【Spark】Spark基础教程知识点
【Spark】Spark基础教程知识点
|
2月前
|
SQL 分布式计算 Java
Spark学习---SparkSQL(概述、编程、数据的加载和保存、自定义UDFA、项目实战)
Spark学习---SparkSQL(概述、编程、数据的加载和保存、自定义UDFA、项目实战)
137 1
|
2月前
|
存储 分布式计算 Spark
实战|使用Spark Streaming写入Hudi
实战|使用Spark Streaming写入Hudi
54 0