基于阿里云容器服务监控 Kubernetes集群GPU指标
### 简介
当您在阿里云容器服务中使用GPU ECS主机构建Kubernetes集群进行AI训练时,经常需要知道每个Pod使用的GPU的使用情况,比如每块显存使用情况、GPU利用率,GPU卡温度等监控信息,本文介绍如何快速在阿里云上构建基于Prometheus + Grafana的GPU监控方案。
阿里云Kubernetes CSI实践 - 部署详解
本文以阿里云ACK环境为例介绍如何在Kubernetes系统中部署CSI插件;
CSI部署拓扑:
分为CSI Provisioner和CSI Plugin两部分:
Provisioner:目前只支持云盘,提供云盘数据卷动态创建的功能;
Plugin:云盘、NAS、OSS均需实现plugin;云盘...
LC3视角:Kubernetes下日志采集、存储与处理技术实践
在Kubernetes服务化、日志处理实时化以及日志集中式存储趋势下,Kubernetes日志处理上也遇到的新挑战,包括:容器动态采集、大流量性能瓶颈、日志路由管理等问题。本文介绍了“Logtail + 日志服务 + 生态”架构,介绍了:Logtail客户端在Kubernetes日志采集场景下的优势;日志服务作为基础设施一站式解决实时读写、HTAP两大日志强需求;日志服务数据的开放性以及与云产品、开源社区相结合,在实时计算、可视化、采集上为用户提供的丰富选择。
K8S环境中NAS卷添加noresvport方法
通过K8S使用NAS卷,请区分以下场景:
静态存储卷: 使用阿里云ACK,PV、PVC方式,nfs驱动; 使用阿里云ACK,PV、PVC方式,Flexvolume驱动; 使用阿里云ACK,Volume方式,nfs驱动; 使用阿里云ACK,Volume方式,Flexvolume驱动;.