【经典面试场景题】线上服务器如果磁盘满了,你会如何处理?
线上服务器磁盘满将导致服务异常,需立即处理。首先通过 `df -h` 和 `du -sh /*` 定位占用空间大的目录,清理临时文件与大日志文件,可清空而非删除正在使用的日志。使用 `find / -size +1G` 查找大文件,释放空间。长期应配置日志轮转、磁盘监控告警、定期清理脚本,并分离系统、数据与日志分区,避免再次打满。
使用helm快速部署prometheus+Grafana
通过Helm快速部署Prometheus监控栈:添加仓库、更新缓存并安装kube-prometheus-stack。建议创建独立命名空间(如monitoring)进行隔离,使用`port-forward`临时访问Prometheus和Grafana界面。通过自定义values.yaml文件可配置持久化、密码等参数,实现灵活管理。
自定义通过helm部署的prometheus+Grafana监控框架
本文基于Helm快速部署kube-prometheus-stack,通过自定义`custom-values.yaml`实现Prometheus与Grafana的精细化配置,涵盖资源限制、持久化存储、服务暴露、告警规则及仪表盘导入,支持K8s集群全方位监控,提升可观测性与运维效率。
图文解析带你精通时序PromQL语法
[阿里云SLS可观测团队发布] 本文通过图文解析深入讲解PromQL的计算原理,涵盖其与SQL的差异、时间线模型、选点机制、聚合函数、窗口函数及常见非预期场景,帮助用户掌握PromQL的核心语法与执行逻辑。