Kubernetes必备知识: Kubernetes资源模型limits

简介: Limits 是 Pod 能使用的资源上限,是实际配置到内核 cgroups 里面的配置数据。对于内存来说,会直接转换成 docker run 命令行的--memory大小,最终会配置到 cgroups 对应任务的/sys/fs/cgroup/memory/……/memory.limit_in_bytes 文件中。

所属技术领域:

Kubernetes

|名词定义|

Limits 是 Pod 能使用的资源上限,是实际配置到内核 cgroups 里面的配置数据。对于内存来说,会直接转换成 docker run 命令行的--memory大小,最终会配置到 cgroups 对应任务的/sys/fs/cgroup/memory/……/memory.limit_in_bytes 文件中。
注意:如果 Limit 没有配置,则表明没有资源的上限,只要节点上有对应的资源,Pod 就可以使用。

|技术特点|

 limits的特点
1.limits限制运行时容器占用的资源
2.limits.cpu会被转换成docker的–cpu-quota参数。与cgroup cpu.cfs_quota_us功能相同
 限制容器的最大CPU使用率。
 cpu.cfs_quota_us参数与cpu.cfs_period_us结合使用,后者设置时间周期
 k8s将docker的–cpu-period参数设置100毫秒。对应着cgroup的cpu.cfs_period_us
 limits.cpu的单位使用m,千分之一核
3.limits.memory会被转换成docker的–memory参数。用来限制容器使用的最大内存
4.当容器申请内存超过limits时会被终止

  1. 容器能使用资源的资源的最大值,设置为0表示使用资源无上限。
    6.Limits的值不能低于Requests的值,否则apiserver会报错。

7.Limits中,CPU和Memory某一项超过kubernetes集群内最大节点配置,则该pod将永远不会被调度到Node上。除非一些云服务商会配置vm伸缩策略去实时增加vm到kubernetes集群上,如GKE。
 request 和 limit 关系
request能保证pod有足够的资源来运行, 而limit则是防止某个pod无限制的使用资源, 导致其他pod崩溃. 两者的关系必须满足:
0 <= request <= limit
如果limit=0表示不对资源进行限制, 这时可以小于request。
目前CPU支持设置request和limit,memory只支持设置request, limit必须强制等于request, 这样确保容器不会因为内存的使用量超过request但是没有超过limit的情况下被意外kill掉。

 limit/request使用示例

apiVersion: apps/v1beta2
kind: Deployment
metadata:
name: nginx
namespace: php
labels:
app: nginx
spec:
revisionHistoryLimit: 10
strategy:
type: RollingUpdate
selector:
matchLabels:

 app: nginx
AI 代码解读

template:
metadata:

 labels:
   app: nginx
AI 代码解读

spec:

 containers:
 - name: nginx
   image: nginx:latest
   ports:
   - containerPort: 80
     protocol: TCP
   resources:
     requests:
       cpu: 0.5
       memory: 1024Mi
     limits:
       cpu: 1
       memory: 2048Mi
AI 代码解读

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: nginx
labels:

app: nginx
AI 代码解读

spec:
scaleTargetRef:

apiVersion: extensions/v1beta1
kind: Deployment
name: nginx
AI 代码解读

minReplicas: 2
maxReplicas: 4
targetCPUUtilizationPercentage: 80
 Limit Range(默认资源配置)
为每个 Pod 都手动配置这些参数是挺麻烦的事情,Kubernetes 提供了 LimitRange 资源,可以让我们配置某个 Namespace 默认的 Request 和 Limit 值,比如下面的实例:
apiVersion: "v1"
kind: "LimitRange"
metadata:
name: you-shall-have-limits
spec:
limits:

- type: "Container"
  max:
    cpu: "2"
    memory: "1Gi"
  min:
    cpu: "100m"
    memory: "4Mi"
  default:
    cpu: "500m"
    memory: "200Mi"
  defaultRequest:
    cpu: "200m"
    memory: "100Mi"
AI 代码解读

如果对应 Namespace 创建的 Pod 没有写资源的 Requests 和 Limits 字段,那么它会自动拥有下面的配置信息:
内存请求是 100Mi,上限是 200Mi
CPU 请求是 200m,上限是 500m

当然,如果 Pod 自己配置了对应的参数,Kubernetes 会使用 Pod 中的配置。使用 LimitRange 能够让 Namespace 中的 Pod 资源规范化,便于统一的资源管理。
 关于Limits的底层实现机制:
图片.png

|资料来源|

名词定义:https://blog.csdn.net/bbwangj/article/details/82355337
技术特点:https://segmentfault.com/a/1190000015849962
技术特点:https://blog.csdn.net/zhonglinzhang/article/details/80663249
技术特点:https://blog.51cto.com/dangzhiqiang/2298673
技术特点:https://blog.csdn.net/qq180782842/article/details/87719739

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
部署DeepSeek但GPU不足,ACK One注册集群助力解决IDC GPU资源不足
借助阿里云ACK One注册集群,充分利用阿里云强大ACS GPU算力,实现DeepSeek推理模型高效部署。
ACK Gateway with AI Extension:大模型推理的模型灰度实践
本文介绍了如何使用 ACK Gateway with AI Extension 组件在云原生环境中实现大语言模型(LLM)推理服务的灰度发布和流量分发。该组件专为 LLM 推理场景设计,支持四层/七层流量路由,并提供基于模型服务器负载感知的智能负载均衡能力。通过自定义资源(CRD),如 InferencePool 和 InferenceModel,可以灵活配置推理服务的流量策略,包括模型灰度发布和流量镜像。
使用容器服务ACK快速部署QwQ-32B模型并实现推理智能路由
阿里云最新发布的QwQ-32B模型,通过强化学习大幅度提升了模型推理能力。QwQ-32B模型拥有320亿参数,其性能可以与DeepSeek-R1 671B媲美。
企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南
企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南
205 12
部署DeepSeek但GPU不足,ACK One注册集群助力解决IDC GPU资源不足
部署DeepSeek但GPU不足,ACK One注册集群助力解决IDC GPU资源不足
131 3
企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南
本教程演示如何在ACK中使用vLLM框架快速部署DeepSeek R1模型推理服务。
使用ACK Edge统一管理多地域的ECS资源
使用ACK Edge统一管理多地域的ECS资源
部署 DeepSeek 但 GPU 不足,ACK One 注册集群助力解决 IDC GPU 资源不足
部署 DeepSeek 但 GPU 不足,ACK One 注册集群助力解决 IDC GPU 资源不足
使用ACK Edge统一管理多地域的ECS资源
本文介绍如何使用ACK Edge来管理分布在多个地域的ECS资源。

推荐镜像

更多
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问