Kubernetes资源申请沾满但是实际的资源占用并不多，是怎么回事？

06-01 1483阅读

Kubernetes资源申请沾满但是实际的资源占用并不多是Kubernetes资源管理中的一个常见误解。

K8s资源管理机制

资源请求(Requests) vs 实际使用量

从你的截图可以看到：

K8s节点资源状态（第一张图）：

CPU请求量：13795m (87%) - 接近资源不足
内存请求量：31397079040 (95%) - 接近资源不足
实际系统资源使用（第二张图）：
- 负载很低：load average 1.15, 1.03, 1.14
- CPU使用率很低
- 内存使用量也不高
  关键概念解释
  
  1. 资源请求(Requests) ≠ 实际使用量
```
# Pod资源定义示例
resources:
  requests:    # 调度器保证分配的资源
    cpu: 500m
    memory: 1Gi
  limits:      # 容器能使用的最大资源
    cpu: 1000m
    memory: 2Gi
```
  2. K8s调度逻辑
  - 调度依据：基于requests进行调度决策
  - 实际使用：Pod可能只用很少的资源
  - 资源预留：系统为每个Pod预留了请求的资源
    常见原因
    
    1. 资源请求过度配置
```
# 检查资源请求配置
kubectl describe pod  | grep -A 10 "Requests"
```
    2. 应用负载波动性
    - 应用可能在特定时间需要更多资源
    - 为了保证服务质量，设置了较高的requests
      3. 安全边界设置
      - 为避免资源竞争，设置了较保守的资源请求
        解决方案
        
        1. 优化资源请求配置
        
        # 分析实际资源使用情况 kubectl top pods --all-namespaces kubectl top nodes
        
        2. 使用VPA (Vertical Pod Autoscaler)
        
        apiVersion: autoscaling.k8s.io/v1 kind: VerticalPodAutoscaler metadata: name: my-app-vpa spec: targetRef: apiVersion: apps/v1 kind: Deployment name: my-app updatePolicy: updateMode: "Auto"
        
        3. 监控和调整
        
        # 查看详细的资源分配情况 kubectl describe node | grep -A 5 "Allocated resources"
        
        建议做法
        
        监控实际使用量：建立长期监控，了解真实资源需求
        逐步调整requests：根据实际使用情况调整资源请求
        使用HPA/VPA：实现动态资源调整
        设置合理的limits：防止单个容器占用过多资源
        总结：K8s报告的"资源不足"是指可分配的资源配额用完了，而不是物理资源用完了。这是K8s确保服务质量和避免资源竞争的保护机制。
        
        （图片来源网络，侵删）
        （图片来源网络，侵删）
        （图片来源网络，侵删）

免责声明：我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明：本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度，360，搜狗等多加搜索引擎自动关键词搜索配图，如有侵权的图片，请第一时间联系我们。