开发者学堂课程【5分钟玩转阿里云容器服务:如何基于 ACK 实现企业 IT 成本治理】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/1038/detail/16109
如何基于 ACK 实现企业 IT 成本治理
内容介绍
一、安装方法
二、集群的成本分析
三、Namespace 的成本分布
四、节点池
五、成本统计
一、安装方法
容器服务之 ACK 成本分析,其中包含企业 IT 成本治理,降本增效方案等。
首先用户需从容器服务 ACK 集群的运维管理,成本分析进入页面,首次进入时需要根据提示手动授权并进行安装组件,通过帮助文档中的授权权限在集群的 WorkerRole 里面进行权限的修改,
并安装组件,此处会安装 ACK cost exporter 以及 ARMS Prometheus 集群组件,安装好后,即可进入 ACK 成本分析的主界面。
二、集群的成本分析
ACK 成本分析提供四个主视角进行集群的成本分析,分别是集群概览视角、 Namespace Node pool 节点池以及 Application 应用视角。首先是集群概览视角,可以看到集群相关的所有资源,天、周、月以及预测的账单。可以看到此集群每天花费了 455 块人民币。
通过 cost Trending 看到每一天的此集群所包含的云资源的成本账单情况。用户可以看到集群22日 ECS 弹性计算实例花费397元人民币。
然后 ACK 也提供 Namespace 的成本分布大盘。用户可以看到集群中,各个 Namespace 的成本分布百分比,以及其中会有集群未分配资源的占比情况。
集群概览大盘提供资源、效率以及水位视图,可以看到 Cost Efficiency 视图中 百分之百代表整个集群所有节点的总容量,其中蓝色的线条代表此时集群中已被分配,获得 request 分配占用的资源。可以看到此集群只分配占用了 45% 的资源,其中 55% 的资源是未被分配的,即可进行浪费的优化。
黄色颜色代表此时集群中所有容器中的进程真实消耗的资源情况。可以看到目前集群中真实资源消耗只占分配资源的 3% 。
此处是应用真实资源浪费的情况,也可进行浪费策略的优化
三、Namespace 的成本分布
Namespace 视角可以更细致地看到各个 Namespace 的成本分布情况,其中包括成本, CPU每核时的单位价格以及资源的用量。 Namespace 视角还提供最浪费的应用的排名,可以看到此 name space 中,所有的 POD 通过浪费率进行排序的列表,可以帮助用户找出此集群中最浪费的应用,并聚焦进行更进一步的优化。
四、节点池
节点池大盘,可以站在不同节点池的视角,查看节点池中,节点应用资源的成本以及资源的水位情况。此处还可以通过节点池的节点的售卖策略,进行优化统计。可以看到此处节点池的所有节点都是 PayAsYouGo (后付费)的,占百分之百。用户可以实时的进行预测,如 PayBy Period (包年包月)。
当节点池的所有节点同时切换成 PayBy Period (包年包月)的售卖策略时,可以每小时节省 3.82元,可切换成包年包月,可节省 34% 的成本。此节点池的所有节点全部切换成 Spot 抢占式策略时,可以每小时节约8.96元,占 80% 的成本,可以为用户,资源配型策略进行优化参考。
五、成本统计
最后 Application 应用视角可以通过 LabelSelect 的方式,筛选出用户关心的应用,并进行成本资源的统计。比如 AI 大数据场景,用户运行一个任务,此任务包括了两个 Pod ,如何在两个 POD 的生命周期中统计成本?
可以通过 POD 的 label 在成本分析的 Application 视角中进行成本统计。
此处只需要通过 LabelSelector 进行筛选,即可以看到此应用有两个 POD ,然后在最近两天时花费了两元,其中每个 POD 的生命周期 Uptime 至今运行了 4.9 个小时,然后每一个 POD 消费的 0.98元。