一、介绍
Open-Falcon 是小米的一款开源的互联网企业级监控系统解决方案。
a.特点
①数据采集免配置:agent自发现、支持Plugin、主动推送模式
②容量水平扩展:生产环境每秒50万次数据收集、告警、存储、绘图,可持续水平扩展。
③告警策略自发现:Web界面、支持策略模板、模板继承和覆盖、多种告警方式、支持回调动作。
④告警设置人性化:支持最大告警次数、告警级别设置、告警恢复通知、告警暂停、不同时段不同阈
值、支持维护周期,支持告警合并。
⑤历史数据高效查询:秒级返回上百个指标一年的历史数据。
⑥Dashboard人性化:多维度的数据展示,用户自定义Dashboard等功能。
⑦架构设计高可用:整个系统无核心单点,易运维,易部署。
b.安装
Open-Falcon,整体可以分为两部分,即绘图组件、告警组件。其中:
①安装绘图组件:负责数据的采集、收集、存储、归档、采样、查询、展示(Dashboard/Screen)等功能,可以单独工作,作为time-series data的一种存储展示方案。
②安装告警组件:负责告警策略配置(portal)、告警判定(judge)、告警处理(alarm/sender)、用户组管理(uic)等,可以单独工作。
注:以下安装操作皆来自于open-falcon book:http://book.open-falcon.org/zh/intro/index.html,可直接前往查看(环境所限并未演示告警部分)。
二、安装(二进制快速安装)
a.环境准备
①安装redis
②安装MariaDB
③创建并进入工作目录
④初始化MariaDB表结构
⑤下载并解压编译好的二进制组件(只能跑64位Linux)
1
2
3
4
5
6
7
8
9
10
|
app=` echo $x| cut -d '-' -f2`; \
mkdir -p $app; \
tar -zxf $x -C $app; \
done
|
b.安装绘图组件
①安装Transfer
transfer默认监听在:8433端口上,agent会通过jsonrpc的方式来push数据上来。
1
2
3
4
5
6
7
8
9
|
falcon-transfer started..., pid=7447
falcon-transfer stoped...
|
②安装Agent
每台机器上,都需要部署agent,agent会自动采集预先定义的各种采集项,每隔60秒,push到transfer。
1
2
3
4
5
6
7
8
9
10
11
12
|
"transfer" : {
"enabled" : true ,
"addrs" : [
"127.0.0.1:8433" ,
"127.0.0.1:8433"
],
falcon-agent started..., pid=9067
|
③安装Graph
graph组件是存储绘图数据、历史数据的组件。transfer会把接收到的数据,转发给graph。
④安装Query
query组件,绘图数据的查询接口,query组件收到用户的查询请求后,会从后端的多个graph,查询相应的数据,聚合后,再返回给用户。
⑤安装Dashboard
dashboard是面向用户的查询界面,在这里,用户可以看到push到graph中的所有数据,并查看其趋势图。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
|
New python executable in . /env/bin/python
Installing Setuptools.............................................................................................................................................................................................................................. done .
Installing Pip..................................................................................................................................................................................................................................................................................................................................... done .
import os
DASHBOARD_DB_HOST = "127.0.0.1"
DASHBOARD_DB_PORT = 3306
DASHBOARD_DB_USER = "root"
DASHBOARD_DB_PASSWD = ""
DASHBOARD_DB_NAME = "dashboard"
GRAPH_DB_HOST = "127.0.0.1"
GRAPH_DB_PORT = 3306
GRAPH_DB_USER = "root"
GRAPH_DB_PASSWD = ""
GRAPH_DB_NAME = "graph"
DEBUG = True
SECRET_KEY = "secret-key"
SESSION_COOKIE_NAME = "open-falcon"
PERMANENT_SESSION_LIFETIME = 3600 * 24 * 30
SITE_COOKIE = "open-falcon-ck"
QUERY_ADDR = "http://127.0.0.1:9966"
BASE_DIR = "/home/work/open-falcon/dashboard/"
LOG_PATH = os.path. join (BASE_DIR, "log/" )
try:
from rrd.local_config import *
except:
pass
falcon-dashboard started..., pid=11835
|
这时候就可以通过http://localhost:8081访问dashboard主页了;
在dashboard首页的endpoint字段中,搜索机器名并点击“刷新counter列表”就可以看到数据了。

本文转自 结束的伤感 51CTO博客,原文链接:http://blog.51cto.com/wangzhijian/1833937