k8s中部署Grafana-prometheus系列文章第二篇

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
可观测监控 Prometheus 版,每月50GB免费额度
简介: k8s中部署Grafana-prometheus系列文章第二篇

前言

上一篇介绍了prometheus的安装配置,大家可访问k8s中部署prometheus监控告警系统-prometheus系列文章第一篇查看,这篇将接着上篇内容介绍Grafana,并在Grafana的web界面导入物理节点和容器的监控模板,并且展示prometheus的监控指标,然后通过alertmanager实现监控报警。

温馨提示

这篇文章和上一篇使用相同的实验环境,大家在看这篇文章之前需要把k8s中部署prometheus监控告警系统-prometheus系列文章第一篇看完,并且按照要求做实验,这样我们在能继续下面的内容

机器规划:

和上一篇文章使用相同的实验环境:

master节点的机器ip是192.168.0.6,主机名是master1

node节点的机器ip是192.168.0.56,主机名是node1

master高可用集群安装可参考如下文章:

k8s1.18高可用集群安装-超详细中文官方文档

k8s1.18多master节点高可用集群安装-超详细中文官方文档

Grafana安装和配置

下载安装Grafana需要的镜像

上传heapster-grafana-amd64_v5_0_4.tar.gz镜像到k8s的各个master节点和k8s的各个node节点,然后在各个节点手动解压:
docker load -i heapster-grafana-amd64_v5_0_4.tar.gz

镜像所在的百度网盘地址如下:

链接:https://pan.baidu.com/s/1TmVGKxde_cEYrbjiETboEA 
提取码:052u

在k8s的master1节点创建grafana.yaml

cat  >grafana.yaml <<  EOF
apiVersion: apps/v1
kind: Deployment
metadata:
  name: monitoring-grafana
  namespace: kube-system
spec:
  replicas: 1
  selector:
    matchLabels:
      task: monitoring
      k8s-app: grafana
  template:
    metadata:
      labels:
        task: monitoring
        k8s-app: grafana
    spec:
      containers:
      - name: grafana
        image: k8s.gcr.io/heapster-grafana-amd64:v5.0.4
        ports:
        - containerPort: 3000
          protocol: TCP
        volumeMounts:
        - mountPath: /etc/ssl/certs
          name: ca-certificates
          readOnly: true
        - mountPath: /var
          name: grafana-storage
        env:
        - name: INFLUXDB_HOST
          value: monitoring-influxdb
        - name: GF_SERVER_HTTP_PORT
          value: "3000"
          # The following env variables are required to make Grafana accessible via
          # the kubernetes api-server proxy. On production clusters, we recommend
          # removing these env variables, setup auth for grafana, and expose the grafana
          # service using a LoadBalancer or a public IP.
        - name: GF_AUTH_BASIC_ENABLED
          value: "false"
        - name: GF_AUTH_ANONYMOUS_ENABLED
          value: "true"
        - name: GF_AUTH_ANONYMOUS_ORG_ROLE
          value: Admin
        - name: GF_SERVER_ROOT_URL
          # If you're only using the API Server proxy, set this value instead:
          # value: /api/v1/namespaces/kube-system/services/monitoring-grafana/proxy
          value: /
      volumes:
      - name: ca-certificates
        hostPath:
          path: /etc/ssl/certs
      - name: grafana-storage
        emptyDir: {}
---
apiVersion: v1
kind: Service
metadata:
  labels:
    # For use as a Cluster add-on (https://github.com/kubernetes/kubernetes/tree/master/cluster/addons)
    # If you are NOT using this as an addon, you should comment out this line.
    kubernetes.io/cluster-service: 'true'
    kubernetes.io/name: monitoring-grafana
  name: monitoring-grafana
  namespace: kube-system
spec:
  # In a production setup, we recommend accessing Grafana through an external Loadbalancer
  # or through a public IP.
  # type: LoadBalancer
  # You could also use NodePort to expose the service at a randomly-generated port
  # type: NodePort
  ports:
  - port: 80
    targetPort: 3000
  selector:
    k8s-app: grafana
  type: NodePort
EOF

通过kubectl apply 更新grafana

kubectl  apply -f grafana.yaml

查看grafana是否部署成功

kubectl get pods -n kube-system

显示如下,说明部署成功

    monitoring-grafana-7d7f6cf5c6-vrxw9   1/1     Running   0          3h51m

    查看grafana的service
    kubectl get svc -n kube-system

    显示如下:

      monitoring-grafana   NodePort    10.111.173.47    <none>        80:31044/TCP             3h54m

      上面可以看到grafana暴露的宿主机端口是31044

      我们访问k8s集群的master节点ip:31044即可访问到grafana的web界面

      Grafan界面接入prometheus数据源

      1)登陆grafana,在浏览器访问

      192.168.0.6:31044

      账号密码都是admin

      可看到如下界面:


      2)配置grafana界面:
      开始配置grafana的web界面:
      选择Create your first data source

      出现如下

      Name: Prometheus

      Type: Prometheus

      HTTP 处的URL写 如下:


      http://prometheus.monitor-sa.svc:9090

      配置好的整体页面如下:

      点击左下角Save & Test,出现如下Data source is working,说明prometheus数据源成功的被grafana接入了

      导入监控模板,可在如下链接搜索
      https://grafana.com/dashboards?dataSource=prometheus&search=kubernetes
      也可直接导入node_exporter.json监控模板,这个可以把node节点指标显示出来

      node_exporter.json在百度网盘地址如下:

        链接:https://pan.baidu.com/s/1vF1kAMRbxQkUGPlZt91MWg 
        提取码:kyd6

        还可直接导入docker_rev1.json,可以把容器相关的数据展示出来
        docker_rev1.json在百度网盘地址如下:


          链接:https://pan.baidu.com/s/17o_nja5N2R-g9g5PkJ3aFA 
          提取码:vinv

          怎么导入监控模板,按如下步骤

          上面Save & Test测试没问题之后,就可以返回Grafana主页面

          点击左侧+号下面的Import,出现如下界面

          选择Upload json file,出现如下

          选择一个本地的json文件,我们选择的是上面让大家下载的node_exporter.json这个文件,选择之后出现如下

          注:箭头标注的地方Name后面的名字是node_exporter.json定义的

          Prometheus后面需要变成Prometheus,然后再点击Import,就可以出现如下界面:

          导入docker_rev1.json监控模板,步骤和上面导入node_exporter.json步骤一样,导入之后显示如下:


          看到这我们就已经把Grafana部署和配置成功了,并且成功的接入了prometheus数据源,但不要着急,这是连载文章,下篇将接着这篇内容介绍Alertmanager并且通过alertmanager实现报警请继续关注,我会把最新知识不间断的分享给大家。


          技术交流群

          相关实践学习
          深入解析Docker容器化技术
          Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。 &nbsp; &nbsp; 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
          相关文章
          |
          7月前
          |
          存储 Kubernetes 开发工具
          使用ArgoCD管理Kubernetes部署指南
          ArgoCD 是一款基于 Kubernetes 的声明式 GitOps 持续交付工具,通过自动同步 Git 存储库中的配置与 Kubernetes 集群状态,确保一致性与可靠性。它支持实时同步、声明式设置、自动修复和丰富的用户界面,极大简化了复杂应用的部署管理。结合 Helm Charts,ArgoCD 提供模块化、可重用的部署流程,显著减少人工开销和配置错误。对于云原生企业,ArgoCD 能优化部署策略,提升效率与安全性,是实现自动化与一致性的理想选择。
          369 0
          |
          6月前
          |
          存储 Kubernetes 异构计算
          Qwen3 大模型在阿里云容器服务上的极简部署教程
          通义千问 Qwen3 是 Qwen 系列最新推出的首个混合推理模型,其在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。
          |
          7月前
          |
          存储 Kubernetes 监控
          K8s集群实战:使用kubeadm和kuboard部署Kubernetes集群
          总之,使用kubeadm和kuboard部署K8s集群就像回归童年一样,简单又有趣。不要忘记,技术是为人服务的,用K8s集群操控云端资源,我们不过是想在复杂的世界找寻简单。尽管部署过程可能遇到困难,但朝着简化复杂的目标,我们就能找到意义和乐趣。希望你也能利用这些工具,找到你的乐趣,满足你的需求。
          676 33
          |
          7月前
          |
          Prometheus Kubernetes 监控
          Kubernetes监控:Prometheus与AlertManager结合,配置邮件告警。
          完成这些步骤之后,您就拥有了一个可以用邮件通知你的Kubernetes监控解决方案了。当然,所有的这些配置都需要相互照应,还要对你的Kubernetes集群状况有深入的了解。希望这份指南能帮助你创建出适合自己场景的监控系统,让你在首次发现问题时就能做出响应。
          347 22
          |
          7月前
          |
          Kubernetes 开发者 Docker
          集群部署:使用Rancher部署Kubernetes集群。
          以上就是使用 Rancher 部署 Kubernetes 集群的流程。使用 Rancher 和 Kubernetes,开发者可以受益于灵活性和可扩展性,允许他们在多种环境中运行多种应用,同时利用自动化工具使工作负载更加高效。
          384 19
          |
          7月前
          |
          存储 测试技术 对象存储
          使用容器服务ACK快速部署QwQ-32B模型并实现推理智能路由
          阿里云最新发布的QwQ-32B模型,通过强化学习大幅度提升了模型推理能力。QwQ-32B模型拥有320亿参数,其性能可以与DeepSeek-R1 671B媲美。
          |
          8月前
          |
          存储 Kubernetes 测试技术
          企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南
          企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南
          343 12
          |
          8月前
          |
          人工智能 Kubernetes 异构计算
          大道至简-基于ACK的Deepseek满血版分布式推理部署实战
          大道至简-基于ACK的Deepseek满血版分布式推理部署实战
          431 5
          |
          8月前
          |
          存储 Kubernetes 对象存储
          部署DeepSeek但GPU不足,ACK One注册集群助力解决IDC GPU资源不足
          部署DeepSeek但GPU不足,ACK One注册集群助力解决IDC GPU资源不足
          196 3
          |
          8月前
          |
          边缘计算 调度 对象存储
          部署DeepSeek但IDC GPU不足,阿里云ACK Edge虚拟节点来帮忙
          部署DeepSeek但IDC GPU不足,阿里云ACK Edge虚拟节点来帮忙
          141 0

          推荐镜像

          更多