1.2 Prometheus 安装

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
日志服务 SLS,月写入数据量 50GB 1个月
简介: Prometheus是一个监控平台,它通过抓取这些目标主机上采集器暴露的指标来展示监控数据。本文介绍如何安装、配置和监控 Prometheus。你需要下载安装 Prometheus 并且安装 Exporter,这些工具采集了主机和对应服务的时间序列数据。

Prometheus是一个监控平台,它通过抓取这些目标主机上采集器暴露的指标来展示监控数据。本文介绍如何安装、配置和监控 Prometheus。你需要下载安装 Prometheus 并且安装 Exporter,这些工具采集了主机和对应服务的时间序列数据。我们的第一个 Exporter 是 Prometheus 本身,它提供了关于内存使用、垃圾收集等各种各样的主机级指标。

下载 Prometheus

首先下载最新版本的 Prometheus 然后解压,下载地址如下:

https://prometheus.io/download

tar xvfz prometheus-*.tar.gz
cd prometheus-*

Prometheus 服务是一个名为 Prometheus( 或Windows系统上的 prometheus.exe)的二进制文件。我们可以运行二进制文件,并通过--help 参数选项来查看帮助,如下所示。

$ ./prometheus --help
usage: prometheus [<flags>]

The Prometheus monitoring server

Flags:
  -h, --help                     Show context-sensitive help (also try --help-long and --help-man).
      --version                  Show application version.
      --config.file="prometheus.yml"
                                 Prometheus configuration file path.
      --web.listen-address="0.0.0.0:9090"
                                 Address to listen on for UI, API, and telemetry.
      --web.read-timeout=5m      Maximum duration before timing out read of the request, and closing idle connections.
      --web.max-connections=512  Maximum number of simultaneous connections.
      --web.external-url=<URL>   The URL under which Prometheus is externally reachable (for example, if Prometheus is served via a reverse
                                 proxy). Used for generating relative and absolute links back to Prometheus itself. If the URL has a path
                                 portion, it will be used to prefix all HTTP endpoints served by Prometheus. If omitted, relevant URL
                                 components will be derived automatically.
      --web.route-prefix=<path>  Prefix for the internal routes of web endpoints. Defaults to path of --web.external-url.
      --web.user-assets=<path>   Path to static asset directory, available at /user.
      --web.enable-lifecycle     Enable shutdown and reload via HTTP request.
      --web.enable-admin-api     Enable API endpoints for admin control actions.
      --web.console.templates="consoles"
                                 Path to the console template directory, available at /consoles.
      --web.console.libraries="console_libraries"
                                 Path to the console library directory.
      --web.page-title="Prometheus Time Series Collection and Processing Server"
                                 Document title of Prometheus instance.
      --storage.tsdb.path="data/"
                                 Base path for metrics storage.
      --storage.tsdb.retention=15d
                                 How long to retain samples in storage.
      --storage.tsdb.no-lockfile
                                 Do not create lockfile in data directory.
      --storage.remote.flush-deadline=<duration>
                                 How long to wait flushing sample on shutdown or config reload.
      --storage.remote.read-sample-limit=5e7
                                 Maximum overall number of samples to return via the remote read interface, in a single query. 0 means no
                                 limit.
      --storage.remote.read-concurrent-limit=10
                                 Maximum number of concurrent remote read calls. 0 means no limit.
      --rules.alert.for-outage-tolerance=1h
                                 Max time to tolerate prometheus outage for restoring 'for' state of alert.
      --rules.alert.for-grace-period=10m
                                 Minimum duration between alert and restored 'for' state. This is maintained only for alerts with configured
                                 'for' time greater than grace period.
      --rules.alert.resend-delay=1m
                                 Minimum amount of time to wait before resending an alert to Alertmanager.
      --alertmanager.notification-queue-capacity=10000
                                 The capacity of the queue for pending Alertmanager notifications.
      --alertmanager.timeout=10s
                                 Timeout for sending alerts to Alertmanager.
      --query.lookback-delta=5m  The delta difference allowed for retrieving metrics during expression evaluations.
      --query.timeout=2m         Maximum time a query may take before being aborted.
      --query.max-concurrency=20
                                 Maximum number of queries executed concurrently.
      --query.max-samples=50000000
                                 Maximum number of samples a single query can load into memory. Note that queries will fail if they would
                                 load more samples than this into memory, so this also limits the number of samples a query can return.
      --log.level=info           Only log messages with the given severity or above. One of: [debug, info, warn, error]
      --log.format=logfmt        Output format of log messages. One of: [logfmt, json]

配置 Prometheus

Prometheus 的配置采用了 YAML 语法描述,Prometheus 下载好以后会有一个示例配置文件,文件名叫 prometheus.yml ,可以先配置这个文件。

将示例配置文件删除注释和一些高级配置以后,剩下的最基本、最少的配置项如下

global:
  scrape_interval:     15s
  evaluation_interval: 15s

rule_files:
  # - "first.rules"
  # - "second.rules"

scrape_configs:
  - job_name: prometheus
    static_configs:
      - targets: ['localhost:9090']

在示例配置文件中有三个配置块:global、rule_files、scrape_configs 。

global 块控制 Prometheus 服务的全局配置,有两个选项。scrape_interval 控制Prometheus 采集数据的频率。你可以为某些指标数据覆盖此选项。默认情况下,全局设置是每15秒采集一次。evaluation_interval选项控制 Prometheus 评估规则的频率。Prometheus 使用规则创建新的时间序列并生成警报。

rule_files 用来指定我们需要加载的规则的配置文件路径,这个配置文件也是 YAML 语法。当前没有配置规则,这部分注释掉不生效。

scrape_configs 控制 Prometheus 监听的资源。由于 Prometheus 还将自己的数据作通过 HTTP 公开出来,因此它可以收集和监控自己的健康状况。在默认配置中有一个名为prometheus 的 job,它抓取 prometheus 服务公开的时间序列数据。该 Job 包含一个静态配置的目标,一般是本地主机的 9090 端口。 Prometheus 希望 Metric 能够在 /metric 的路径上可用。所以默认的 job 可以通过如下 RUEL 来采集,http://localhost:9090/metrics .

返回的时间序列数据详细描述了 Prometheus 服务的状态和性能。

对于完整的配置文件,可以查看官网的文档 , 后续我也会整理出来。

启动 Prometheus

使用刚才修改好的配置文件来启动 Prometheus,切换到 Prometheus 二进制文件的目录下,执行如下命令。

./prometheus --config.file=prometheus.yml

当二进制文件和配置文件在同一个目录的时候可以直接使用上述命令。如果不在同一个目录,请指定配置文件的绝对路径。

这样 Prometheus 就会启动起来。你可以使用浏览器访问 http://localhost:9090 地址可以看到关于它自身的状态页面,Prometheus 在启动 30 秒以后在页面就可以看到数据了。

你也可以通过访问 http://localhost:9090/metrics,来验证 Prometheus 是否在暴露自己的指标。

使用浏览器查看

我们来看一下 Prometheus 收集的一些关于自己的数据。访问 http://localhost:9090/graph,并在 “graph” 选项卡中选择 “Console” 视图。

promhttp_metric_handler_requests_total (Prometheus 提供的一个Metric 名称) 输入到控制台,这将返回许多不同的时间序列(以及为每个时间序列记录的最新值),所有这些时间序列的 Metric 名称都是 promhttp_metric_handler_requests_total,但是具有不同的 label 。这些 label 指定不同的请求状态。

如果想看 HTTP 请求返回码 200 的数据,可以使用下面这条语句:

promhttp_metric_handler_requests_total{code="200"}

如果要计算返回的时间序列的数量,可以使用 count 来查询,后边会写到函数相关的内容:

count(promhttp_metric_handler_requests_total)

推荐目录结构

新安装的 Prometheus 建议使用如下目录结构进行调整。

.
├── conf
│   └── prometheus.yml
├── current -> deploy/prometheus-2.8.1.linux-amd64
├── data
├── deploy
│   └── prometheus-2.8.1.linux-amd64
│       ├── LICENSE
│       ├── NOTICE
│       ├── console_libraries
│       ├── consoles
│       ├── prometheus
│       ├── prometheus.yml
│       └── promtool
├── logs
│   └── prometheus.log
├── run
│   └── prometheus.pid
└── scripts
    └── run.sh

conf 目录用来存储 Prometheus 的配置文件,启动的时候指定配置文件。

current 该目录软连接到二进制文件所在的目录

data Prometheus 数据库的数据存储位置,

deploy 放置 Prometheus 的二进制文件,方便 current 进行软连接

logs 存放日志。如果普通用户启动,建议日志放置在这个目录。如果 root 用户启动,日志可以放在这个目录,也可以放在 /var/log/messages

scripts 放置启动脚本。如果普通用户启动 ,放置启动进程的脚本。如果 root 用户启动,可以放置脚本到该目录,或者写成系统服务。

使用该目录结构可以方便的进行备份、迁移、升级、维护。

提供一个启动脚本 start.sh 的参考模板

PATH=/opt/prometheus
LOG=$BASEPATH/logs
nohup $PATH/current/prometheus --config.file=$PATH/conf/prometheus.yml --web.listen-address=:9090 --storage.tsdb.path=$PATH/data/  --storage.tsdb.retention=30d >> $LOG/prometheus.log  2>&1 & echo $! > $PATH/run/prometheus.pid

该脚本做了如下内容

  • 指定配置文件
  • 指定数据暴露的端口
  • 指定数据文件存储的路径
  • 指定数据文件存储的时间(轮询时间)
  • 指定日志的存储位置(nohup 输出作为日志)
  • 生成 PID 文件

CentOS 7 启动脚本可以使用如下模板,

[Unit]
Description=Prometheus Node Exporter
After=network.target

[Service]
ExecStart=/opt/prometheus/current/prometheus --config.file=/opt/prometheus/conf/prometheus.yml --web.listen-address=:9090 --storage.tsdb.path=/opt/prometheus/data/  --storage.tsdb.retention=30d
User=root

[Install]
WantedBy=multi-user.target
  • 使用 root 用户启动
  • 日志会存储在 /var/log/messages
  • 指定配置文件
  • 指定数据暴露的端口
  • 指定数据文件存储的路径
  • 指定数据文件存储的时间(轮询时间)

大家根据自己需求取用、修改。

相关实践学习
容器服务Serverless版ACK Serverless 快速入门:在线魔方应用部署和监控
通过本实验,您将了解到容器服务Serverless版ACK Serverless 的基本产品能力,即可以实现快速部署一个在线魔方应用,并借助阿里云容器服务成熟的产品生态,实现在线应用的企业级监控,提升应用稳定性。
相关文章
|
6月前
|
Prometheus 监控 Kubernetes
Prometheus + Grafana安装
Prometheus + Grafana安装
|
6月前
|
Prometheus Cloud Native Java
微服务框架(二十三)Prometheus + Grafana 安装、配置及使用
此系列文章将会描述Java框架Spring Boot、服务治理框架Dubbo、应用容器引擎Docker,及使用Spring Boot集成Dubbo、Mybatis等开源框架,其中穿插着Spring Boot中日志切面等技术的实现,然后通过gitlab-CI以持续集成为Docker镜像。 本文为Prometheus + Grafana 安装、配置及使用 本系列文章中所使用的框架版本为Spring ...
|
25天前
|
Prometheus 监控 Cloud Native
基于Docker安装Grafana和Prometheus
Grafana 是一款用 Go 语言开发的开源数据可视化工具,支持数据监控和统计,并具备告警功能。通过 Docker 部署 Grafana 和 Prometheus,可实现系统数据的采集、展示和告警。默认登录用户名和密码均为 admin。配置 Prometheus 数据源后,可导入主机监控模板(ID 8919)进行数据展示。
65 2
|
3月前
|
Prometheus 监控 Kubernetes
prometheus学习笔记之简介与安装
prometheus学习笔记之简介与安装
prometheus学习笔记之简介与安装
|
2月前
|
Prometheus 监控 Cloud Native
docker安装prometheus+Granfan并监控容器
【9月更文挑战第14天】本文介绍了在Docker中安装Prometheus与Grafana并监控容器的步骤,包括创建配置文件、运行Prometheus与Grafana容器,以及在Grafana中配置数据源和创建监控仪表盘,展示了如何通过Prometheus抓取数据并利用Grafana展示容器的CPU使用率等关键指标。
|
2月前
|
存储 Prometheus 监控
在Ubuntu系统上安装与配置Prometheus的步骤
通过以上步骤,您应该已经成功在Ubuntu系统上安装并配置了Prometheus。您现在可以开始使用Prometheus收集和分析您的系统和应用程序的指标数据了。
181 1
|
3月前
|
Prometheus 监控 Cloud Native
prometheus学习笔记之Grafana安装与配置
prometheus学习笔记之Grafana安装与配置
|
Prometheus Cloud Native
Mac下安装 Prometheus+Grafana
Mac下安装 Prometheus+Grafana
421 0
|
6月前
|
Prometheus 监控 Cloud Native
Prometheus 安装与配置
Prometheus 安装与配置
|
6月前
|
Prometheus Cloud Native 数据安全/隐私保护
Prometheus实战篇:docker安装Prometheus
Docker搭建Prometheus监控系统
下一篇
无影云桌面