系统监控+性能监控|学习笔记

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 快速学习系统监控+性能监控

开发者学堂课程【大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop 框架搭建)第一阶段系统监控+性能监控】学习笔记,与课程紧密联系,让用户快速学习知识。  

课程地址:https://developer.aliyun.com/learning/course/669/detail/11586


系统监控+性能监控

 

内容介绍:

一、数据预处理

二、爬虫识别

三、总结

 

一、数据预处理

图片1.png

3-1 Kafka 中读取出数据,3-2读取出相应规则,在数据预处理阶段进行处理,4处理结束后,写入 Kafka 中,此过程均在后台运行。使用者在预处理环节可以在首页可以看到系统监控页面。

 图片2.png1. 系统监控功能:

监控整个数据预处理阶段的效率及每条链路、每一节点所采集的数据情况。

在数据预处理阶段,每个模块执行结束之后,会出现以下界面。

(1)实时流量转发

在一段时间范围内,每一链路,每台服务器,在每一分钟,分别采集了多少数据,表征为曲线图。

当只有一台服务器时采集的数据绘制出来只有一条曲线图,若链路中有3台服务器,则下图中将绘制3条曲线图。

图片3.png

如图,在15:41:35到15:43:25这段时间内,大约有25人左右的数据访问量。

(2)系统功能运行情况

测试数据采集及数据预处理阶段的系统运行情况。若系统运行正常,则显示绿色,若系统运行不正常,则显示红色。

图片4.png

(3)各链路流量转发情况

各个服务器的转发情况 ,即每一个节点最后一次的请求量,表征为柱状图。多节点多个服务器表征为多个柱状图。

各链路流量转发情况就是实时流量转发情况的最后一点最后一次变化时数据采集及预处理阶段的运行状况。图片5.png如图,表示192.168.2.141节点最后一次被访问量为202。

2.数据系统监控功能所传达的信息:数据预处理部分已有多少节点正在运行,每一节点采集了多少数据及它们在一段时间范围内的变化。

 

二、爬虫识别

第二阶段为爬虫识别阶段(5-1,5-2,6),这一阶段也在后台运行。在首页可以看到性能监控界面。

图片6.png

在该课程的反爬虫项目中,爬虫识别是由 SparkStreaming 来实时进行的。

故在系统功能完成之后,性能监控模块的左侧仪表盘(实时)数字与指针会发生变化,且速度较快。若实时表盘指针与数据不发生改变,则爬虫识别某一阶段存在错误。

1.性能监控

监控数据爬虫识别过程的效率及速度(5-1,5-2,6(图1所示))

图片7.png

三、总结

功能描述:数据预处理、爬虫计算

功能描述:数据预处理、爬虫计算

1.数据分类与处理模块:

(1)读取规则:

①规则起始的时候是在 Mysql 数据库中的,是通过 web 端动态配置的;

②将 Mysql 中的数据读取到 Redis 中使用,提高性能,并提供动态更新功能;

③将 Redis 中的规则同步到广播变量中,达到每个节点都能使用的效果;

在数据处理流程中,3-1读取数据,3-2读取规则,4将数据写入 Kafka 集群,5-1读取数据,5-2读取规则,6将处理后的结果写入 Redis 中,

(2)数据处理:

①拿到规则进行数据的清洗、分类等功能;

②涉及到了部分的指标: cookie 、 agent 、高频 ip ;

2.报表模块:

①报表是通过离线进行统计的,离线的数据来源是通过流式处理打到 hdfs 的;

②报表的指标包含:购票的转化率、查定比、爬虫的规律、系统稳定性;

以上即为反爬虫项目中,企业端的系统监控与性能监控及其所需要实现的功能。

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
SQL 缓存 监控
MyCat - 高级 - MyCat-Web 性能监控 | 学习笔记
快速学习 MyCat - 高级 - MyCat-Web 性能监控
MyCat - 高级 - MyCat-Web 性能监控 | 学习笔记
|
缓存 Prometheus 监控
9.Spring Boot2.5实战 - 应用程序性能监控|学习笔记
快速学习9.Spring Boot2.5实战 - 应用程序性能监控。
301 0
9.Spring Boot2.5实战 - 应用程序性能监控|学习笔记
|
8月前
|
SQL 运维 监控
关系型数据库性能监控工具
【5月更文挑战第21天】
150 2
|
5月前
|
监控 Java 开发者
揭秘Struts 2性能监控:选对工具与方法,让你的应用跑得更快,赢在起跑线上!
【8月更文挑战第31天】在企业级应用开发中,性能监控对系统的稳定运行至关重要。针对流行的Java EE框架Struts 2,本文探讨了性能监控的工具与方法,包括商用的JProfiler、免费的VisualVM以及Struts 2自带的性能监控插件。通过示例代码展示了如何在实际项目中实施这些监控手段,帮助开发者发现和解决性能瓶颈,确保应用在高并发、高负载环境下稳定运行。选择合适的监控工具需综合考虑项目需求、成本、易用性和可扩展性等因素。
53 0
|
5月前
|
Java 开发者 前端开发
Struts 2、Spring MVC、Play Framework 上演巅峰之战,Web 开发的未来何去何从?
【8月更文挑战第31天】在Web应用开发中,Struts 2框架因强大功能和灵活配置备受青睐,但开发者常遇配置错误、类型转换失败、标签属性设置不当及异常处理等问题。本文通过实例解析常见难题与解决方案,如配置文件中遗漏`result`元素致页面跳转失败、日期格式不匹配需自定义转换器、`<s:checkbox>`标签缺少`label`属性致显示不全及Action中未捕获异常影响用户体验等,助您有效应对挑战。
110 0
|
5月前
|
SQL 监控 关系型数据库
SQL性能监控与调优工具的神奇之处:如何用最佳实践选择最适合你的那一个,让你的数据库飞起来?
【8月更文挑战第31天】在现代软件开发中,数据库性能监控与调优对应用稳定性至关重要。本文对比了数据库内置工具、第三方工具及云服务工具等几种常用SQL性能监控与调优工具,并通过示例代码展示了如何利用MySQL的EXPLAIN功能分析查询性能。选择最适合的工具需综合考虑功能需求、数据库类型及成本预算等因素。遵循了解工具功能、试用工具及定期维护工具等最佳实践,可帮助开发者更高效地管理和优化数据库性能,迎接未来软件开发中的挑战与机遇。
69 0
|
6月前
|
运维 监控 Java
(十)JVM成神路之线上故障排查、性能监控工具分析及各线上问题排错实战
经过前述九章的JVM知识学习后,咱们对于JVM的整体知识体系已经有了全面的认知。但前面的章节中,更多的是停留在理论上进行阐述,而本章节中则更多的会分析JVM的实战操作。
150 1
|
5月前
|
存储 监控 Ubuntu
完全交互式!易于使用的 Linux 性能监控工具
完全交互式!易于使用的 Linux 性能监控工具
|
6月前
|
Prometheus 监控 数据可视化
性能测试:主流性能监控工具介绍
Linux系统中,`vmstat`和`top`提供基本监控;Nmon是实时性能分析工具,轻量且功能丰富;Collectd+InfluxDB+Grafana组合用于系统数据收集、存储和可视化;Prometheus+Grafana则提供灵活的监控和定制化仪表板。这些工具帮助企业监控系统性能,及时发现和解决问题。
|
监控 Oracle 数据可视化
深度解析JVM性能监控工具:推荐与详细用法
深度解析JVM性能监控工具:推荐与详细用法
1075 0

相关课程

更多