数据预处-理用例流程介绍|学习笔记

简介: 快速学习数据预处-理用例流程介绍

开发者学堂课程【大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建):数据预处-理用例流程介绍】学习笔记与课程紧密联系,让用户快速学习知识

课程地址https://developer.aliyun.com/learning/course/670/detail/11622


数据预处-理用例流程介绍

 

内容介绍:

一、数据预处理模块

二、模块分类处理流程

 

一、数据预处理模块

下图为数据预处理模块,由统计、脱敏、拆分、分类、解析、结构化、推送、监控等组成,形成了一个完整的处理流程。

 image.png

 

二、模块分类处理流程

image.png

首先数据读取把数据读取过来,也就是下图中3-1的过程(在kalfka中读取数据到程序中),也就是打在kalfka中的数据。

image.png

然后进行第一个模块链路统计,然后进行最核心部分预处理就是清洗、脱敏、拆分、分类、解析、历史爬虫结构化。

然后重新发回 kafka,也就是第四阶段。最后进行系统监控也就是从开始读取到最后的推送的过程进行监控。

image.png

监控分别统计出来有多少访问量,当前连接数是多少:

image.png

还有链路统计要展现在部署服务器名称、当前活跃连接数、最近三天采集数据量。

image.png

相关文章
|
4月前
|
算法 测试技术 API
测试使用 SenseVoice 的流程
8月更文挑战第10天
439 8
|
4月前
|
测试技术
测试与开发问题之测试用例设计的重点是什么,如何实现
测试与开发问题之测试用例设计的重点是什么,如何实现
|
7月前
|
测试技术
需求分析阶段,测试可以做什么?
需求分析阶段,测试可以做什么?
206 0
|
7月前
|
测试技术
『测试基础』| 如何理解测试用例管理和缺陷管理?
『测试基础』| 如何理解测试用例管理和缺陷管理?
222 1
|
测试技术
测试一个项目的流程
测试一个项目的流程
|
数据采集 监控 前端开发
数据预处理总结—用例及流程|学习笔记
快速学习数据预处理总结—用例及流程
969 0
数据预处理总结—用例及流程|学习笔记
|
数据采集 消息中间件 监控
项目总体数据处理流程详解|学习笔记
快速学习项目总体数据处理流程详解
项目总体数据处理流程详解|学习笔记
|
消息中间件 缓存 中间件
【测试基础】二、我好像真的不会设计“好的”测试用例
【测试基础】二、我好像真的不会设计“好的”测试用例
【测试基础】二、我好像真的不会设计“好的”测试用例
|
前端开发 测试技术 数据库
接口测试平台183:并发用例报告数据收集-数据准备/bug修复阶段 (1)
接口测试平台183:并发用例报告数据收集-数据准备/bug修复阶段 (1)
接口测试平台183:并发用例报告数据收集-数据准备/bug修复阶段 (1)
|
测试技术 数据库
接口测试平台184:并发用例报告数据收集-数据准备/bug修复阶段 (2)
接口测试平台184:并发用例报告数据收集-数据准备/bug修复阶段 (2)
接口测试平台184:并发用例报告数据收集-数据准备/bug修复阶段 (2)