运维

首页 标签 运维
# 运维 #
关注
37876内容
09 | 健康检测:这个节点都挂了,为啥还要疯狂发请求?
本文深入探讨RPC框架中的服务健康检测机制,针对超大规模集群下节点状态感知难题,提出“推拉结合,以拉为准”的核心思路。通过分析真实线上故障,揭示传统心跳机制在判断“半死不活”节点时的局限性,并引入基于业务请求可用率的动态评估方案,提升服务可用性。文章还对比汽车中控反馈系统,类比设计多维度健康检测模型,涵盖连接状态、心跳响应与业务成功率,最终实现更精准的节点筛选与容错控制,保障分布式系统的稳定运行。
物理部署图
物理部署图从运维视角展示系统运行时的硬件配置与软件部署结构,用于理解分布式系统。包含节点、构件、物件、连接和框架五大元素,描述应用如何在硬件上部署及相互协作,是实现开发与运维协同的重要工具。
物理部署图
物理部署图描述系统运行时的硬件配置与软件部署结构,展现节点、构件、物件及连接关系,帮助理解分布式系统的网络架构与运维部署,常用于指导应用与硬件的集成。
23优雅关闭:如何避免服务停机带来的业务损失?
本文详解RPC中“优雅关闭”的重要性及实现方案。服务重启时,若未妥善处理,可能导致调用方请求失败。通过引入关闭钩子、设置请求挡板、主动通知调用方并结合引用计数等待在途请求完成,可实现无损下线。同时强调,仅依赖注册中心的服务发现无法保证实时性,需在服务端主动控制。最终确保关闭过程中新请求被拦截、旧请求被完成,保障业务连续性。
SpringMVC总结
该图展示了一个基于云原生技术的现代化应用架构,涵盖微服务、容器化、服务网格、可观测性及自动化运维等核心组件,体现了高效、弹性、可扩展的系统设计思想。
如何做好SQL质量监控
SLS推出用户级SQL质量监控功能,集成于CloudLens for SLS,提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度,助力用户全面掌握SQL使用情况,识别异常、优化性能,提升日志分析效率与资源管理能力。
生产环境缺陷管理
git-poison基于go-git实现分布式bug追溯管理,解决多分支开发中bug漏修、漏发等协同难题。通过“投毒-解毒-银针”机制,自动化卡点发布流程,降低沟通成本,避免人为失误,已在大型团队落地一年,显著提升发布安全与效率。
|
4天前
| |
来自: 通义灵码
记Arthas实现一次CPU排查与代码热更新
本文介绍如何使用Arthas排查线上Java应用CPU占用过高问题。通过`thread`定位高耗能线程,`watch`监控方法调用与异常,结合`jad`反编译与`redefine`实现热更新,无需重启服务即可修复代码,提升线上问题响应效率。适用于SpringBoot + JDK8环境。
15-Portainer轻量级图形化监控 Portainer:Docker轻量级可视化工具
Portainer是一款轻量级Docker图形化管理工具,支持单机与集群环境,提供开源(CE)和商业版(BE/EE)。通过Docker部署,映射端口并挂载卷后即可运行,访问9000端口可进入界面。首次使用需创建管理员账号,可直观管理镜像、容器、网络、数据卷及Stack编排,简化运维操作。
3.6.基于注解声明队列和交换机
通过SpringAMQP,程序可自动声明队列和交换机,避免手动配置出错。支持@Bean方式和更简洁的@RabbitListener注解方式,实现启动时自动创建。同时,默认JDK序列化存在体积大、不安全等问题,需优化消息转换器。
免费试用