监控

首页 标签 监控
# 监控 #
关注
74386内容
EFC&CTO:缓存引发数据不一致问题排查与深度解析
EFC客户端更新缓存架构后,CTO测试出现data mismatch。经排查,因分布式缓存版本号回退,导致读取旧NULL数据写入pagecache,脏页回刷时破坏文件系统数据。定位后通过维护递增版本号修复,10轮测试无异常。问题揭示了buffer写、append写等POSIX行为及缓存一致性设计要点。
OOM排查之路:一次曲折的线上故障复盘
本文记录了一次线上服务因Paimon数据湖与RocksDB集成引发的三次内存溢出(OOM)故障排查全过程。通过MAT、NMT、async-profiler等工具,结合监控分析与专家协作,最终定位到RocksDB通过JNI申请堆外内存未释放的根源问题,并推动架构优化:由应用直写改为Flink统一入湖。分享排查思路与工具使用,为同类技术栈提供借鉴。
|
3天前
|
微服务保护Sentinel
本课程深入讲解微服务中的雪崩问题及其解决方案,重点介绍阿里开源的流量治理组件Sentinel。内容涵盖Sentinel的部署与整合、限流模式(直接、关联、链路)、流控效果(快速失败、预热、排队等待)、熔断降级、线程隔离及授权规则等核心功能,并结合JMeter压测工具进行实战验证,帮助开发者构建高可用的分布式系统。
|
3天前
|
Sentinel工作原理
Sentinel 是面向分布式服务架构的流量控制组件,核心概念包括资源、规则及插槽链。通过定义资源与实时规则,实现流量控制、熔断降级和系统保护,保障系统稳定性。
09 | 健康检测:这个节点都挂了,为啥还要疯狂发请求?
本文深入探讨RPC框架中的服务健康检测机制,针对超大规模集群下节点状态感知难题,提出“推拉结合,以拉为准”的核心思路。通过分析真实线上故障,揭示传统心跳机制在判断“半死不活”节点时的局限性,并引入基于业务请求可用率的动态评估方案,提升服务可用性。文章还对比汽车中控反馈系统,类比设计多维度健康检测模型,涵盖连接状态、心跳响应与业务成功率,最终实现更精准的节点筛选与容错控制,保障分布式系统的稳定运行。
15-Portainer轻量级图形化监控
Portainer是一款轻量级Docker可视化管理工具,支持单机与集群环境,提供图形化界面,便于管理镜像、容器、网络等资源。通过Docker运行,开源版(CE)免费使用,安装便捷,适合初学者与开发者高效管理Docker。
16-CIG重量级监控
CIG由CAdvisor、InfluxDB和Grafana组成,实现容器监控、数据存储与可视化。CAdvisor采集CPU、内存等信息,InfluxDB持久化时序数据,Grafana提供图形化展示与报警功能,适用于Docker环境的重量级监控方案。
|
4天前
|
2. 整合切面,参数拦截+过滤
该类通过AOP切面记录Web请求日志,自动拦截Controller层请求,输出请求来源、URL、方式、方法及参数,并统计执行耗时,便于调试与监控,支持后续扩展至数据库或ELK存储。
Thread.sleep(0) 到底有什么用(读完就懂)
Thread.Sleep用于让线程暂停执行一段时间,不参与CPU竞争。Sleep(1000)不代表1秒后立即恢复,取决于系统调度;而Sleep(0)会触发操作系统立即重新进行CPU分配,给予其他线程执行机会,避免界面假死。
Activiti工程分享
本系列包含两个Activiti实战项目:1)ActivitiDemo提供快速上手教程与基础示例;2)Activiti实现完整审批流程,涵盖流程定义、任务处理与监控。代码清晰,适合学习与实际应用参考。
免费试用