系统监控+性能监控|学习笔记

本文涉及的产品
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: 快速学习系统监控+性能监控

开发者学堂课程【大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop 框架搭建)第一阶段系统监控+性能监控】学习笔记,与课程紧密联系,让用户快速学习知识。  

课程地址:https://developer.aliyun.com/learning/course/669/detail/11586


系统监控+性能监控

 

内容介绍:

一、数据预处理

二、爬虫识别

三、总结

 

一、数据预处理

图片1.png

3-1 Kafka 中读取出数据,3-2读取出相应规则,在数据预处理阶段进行处理,4处理结束后,写入 Kafka 中,此过程均在后台运行。使用者在预处理环节可以在首页可以看到系统监控页面。

 图片2.png1. 系统监控功能:

监控整个数据预处理阶段的效率及每条链路、每一节点所采集的数据情况。

在数据预处理阶段,每个模块执行结束之后,会出现以下界面。

(1)实时流量转发

在一段时间范围内,每一链路,每台服务器,在每一分钟,分别采集了多少数据,表征为曲线图。

当只有一台服务器时采集的数据绘制出来只有一条曲线图,若链路中有3台服务器,则下图中将绘制3条曲线图。

图片3.png

如图,在15:41:35到15:43:25这段时间内,大约有25人左右的数据访问量。

(2)系统功能运行情况

测试数据采集及数据预处理阶段的系统运行情况。若系统运行正常,则显示绿色,若系统运行不正常,则显示红色。

图片4.png

(3)各链路流量转发情况

各个服务器的转发情况 ,即每一个节点最后一次的请求量,表征为柱状图。多节点多个服务器表征为多个柱状图。

各链路流量转发情况就是实时流量转发情况的最后一点最后一次变化时数据采集及预处理阶段的运行状况。图片5.png如图,表示192.168.2.141节点最后一次被访问量为202。

2.数据系统监控功能所传达的信息:数据预处理部分已有多少节点正在运行,每一节点采集了多少数据及它们在一段时间范围内的变化。

 

二、爬虫识别

第二阶段为爬虫识别阶段(5-1,5-2,6),这一阶段也在后台运行。在首页可以看到性能监控界面。

图片6.png

在该课程的反爬虫项目中,爬虫识别是由 SparkStreaming 来实时进行的。

故在系统功能完成之后,性能监控模块的左侧仪表盘(实时)数字与指针会发生变化,且速度较快。若实时表盘指针与数据不发生改变,则爬虫识别某一阶段存在错误。

1.性能监控

监控数据爬虫识别过程的效率及速度(5-1,5-2,6(图1所示))

图片7.png

三、总结

功能描述:数据预处理、爬虫计算

功能描述:数据预处理、爬虫计算

1.数据分类与处理模块:

(1)读取规则:

①规则起始的时候是在 Mysql 数据库中的,是通过 web 端动态配置的;

②将 Mysql 中的数据读取到 Redis 中使用,提高性能,并提供动态更新功能;

③将 Redis 中的规则同步到广播变量中,达到每个节点都能使用的效果;

在数据处理流程中,3-1读取数据,3-2读取规则,4将数据写入 Kafka 集群,5-1读取数据,5-2读取规则,6将处理后的结果写入 Redis 中,

(2)数据处理:

①拿到规则进行数据的清洗、分类等功能;

②涉及到了部分的指标: cookie 、 agent 、高频 ip ;

2.报表模块:

①报表是通过离线进行统计的,离线的数据来源是通过流式处理打到 hdfs 的;

②报表的指标包含:购票的转化率、查定比、爬虫的规律、系统稳定性;

以上即为反爬虫项目中,企业端的系统监控与性能监控及其所需要实现的功能。

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
10月前
|
运维 Prometheus 监控
可观测性与应用监控:实时性能分析和故障排查
在现代软件开发中,应用程序的可观测性和实时性能分析变得越来越重要。随着应用程序规模和复杂性的增加,我们需要能够及时发现和解决潜在的性能问题和故障,并保持应用程序的高可用性。在本文中,我们将讨论可观测性的概念以及应用监控中的实时性能分析和故障排查方法。
140 0
|
存储 监控 Java
性能监控和工具使用
性能监控和工具使用
性能监控和工具使用
|
监控 Java
|
运维 监控 数据可视化
JVM性能监控与故障处理工具
JVM性能监控与故障处理工具
140 0
JVM性能监控与故障处理工具
|
监控 数据可视化 IDE
jvm系列(5)性能监控工具
在平时的开发当中我们总是会遇到各种各样的问题,比如说内存泄漏、死锁、CPU等。遇到问题不可怕,关键是我们如何去排查这些错误,对症下药才是根本。不过对于很多人来说,往往找不到这些问题的根本所在,因此这篇文章主要是让我们掌握一些工具来分析到底是哪里出现了问题。 在之前的文章中,主要是分析了JVM的内存结构、类加载机制和垃圾回收机制。文章的顺序也是循序渐进的,从这篇文章当中我们主要是分析JDK自带的工具,把理论应用于实践。 首先我们先对几种要讲的工具进行一个概述,然后再分别分析
368 0
jvm系列(5)性能监控工具
网络性能监控工具
本文研究全球及中国市场网络性能监控工具现状及未来发展趋势,侧重分析全球及中国市场的主要企业,同时对比北美、欧洲、中国、日本、东南亚和印度等地区的现状及未来发展趋势
|
监控 NoSQL 关系型数据库
服务性能监控都包括哪些指标?
Apache性能监控支持以下指标: Apache吞吐率 Apache并发连接数 Apache并发连接数详细统计,包括读取请求、持久连接、发送响应内容、关闭连接、等待连接 Lighttpd性能监控支持以下指标: Lighttpd吞吐率 Lighttpd并发连接数 Lighttpd并发连接数详细统计,...
1279 0
|
监控 Linux UED
一种对云主机进行性能监控的监控系统及其监控方法
本发明提供了一种对云主机进行性能监控的监控系统及监控方法,所述监控方法同时通过云主机Agent模块、计算节点Agent模块以及站点监控模块采集云主机的虚拟资源利用状态进行监控以获得监控数据。
2724 0
|
监控 Cloud Native Prometheus