Neo4j 企业版和系统运维系统监控

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
可观测可视化 Grafana 版,10个用户账号 1个月
简介: Neo4j 企业版和系统运维系统监控

Neo4j企业版支持Prometheus,可以将集群指标采集到安装目录的../neo4j/metrics目录下,而Prometheus本身的可视化做的并不好,因此利用Grafana进行可视化展示。

   在写这篇博客之前没有搜到搭建教程,因此记录下自己的搭建过程。

   搭建之前需要在neo4j.conf配置文件中添加以下配置,并重启。

metrics.prometheus.enabled=true
metrics.prometheus.endpoint=本机IP地址:2004

   至于完整的Neo4j安装教程可以参考我以前的两篇博客

   Neo4j单机部署教程(企业版)         Neo4j三核心因果集群部署教程(企业版)

开始搭建(以三核心集群为例)

准备工作

所需软件及下载地址:

      node_exporter-*.tar.gz(主机信息采集)及prometheus-*.tar.gz:官网下载地址,同一个页面中。

      grafana-*.rpm:官网下载地址

      grafana-piechart-panel-*.zip(grafana监控模板中有饼图,需要这个插件):官网下载地址

      grafana监控模板:官网下载地址

部署Prometheus和Grafana的服务器:192.168.1.4

被监控服务器(即运行Neo4j的服务器):192.168.1.1、192.168.1.2、192.168.1.3

架构如下:

                                       

一、在运行Neo4j的服务器安装node_exporter

  在三台服务器上, 直接解压运行

解压
tar -zxvf node_exporter-*.tar.gz
进入文件夹
cd node_exporter-*
运行
./node_exporter &

二、安装prometheus

   建议单独部署在一台服务器上。

   1、部署。步骤如下:

解压
tar -zxvf prometheus-*.tar.gz
进入文件夹
cd prometheus-*
配置
vi prometheus.yml
添加以下内容(在scrape_configs:下添加)
    # 监控作业的名字,起集群名字就好
    - job_name: 'Neo4j-cluster-1'
        static_configs:
        # 集群内的节点IP地址
        - targets: ['192.168.1.1:2004','192.168.1.2:2004','192.168.1.3:2004']
启动prometheus
./prometheus --config.file=prometheus.yml &

   2、登录。启动之后,登录prometheus查看配置是否成功。地址:192.168.1.4:9000

   3、检查。点击页面的Status-->Targets。查看job名是不是对的,endpoint地址是不是集群的节点地址,state是不是都是up。如下图:

                 

   再点击Graph,这里可以查到已经采集到的Neo4j指标,如下图:

                 

 

   至此,Prometheus已经完成了,开始安装Grafana!

三、Grafana部署(这里主要贴下我的配置)

   1、直接运行以下命令安装

rpm -ivh grafana-*.rpm

   2、启动

service grafana-server start

   3、登录

   192.168.1.4:3000,默认账号密码admin/admin

   4、创建数据源,如下图:

           

   5、数据源配置如下:

                                     

   6、导入前面下载的Neo4j模板

   效果如下(我在模板的基础上新增了面板,并进行了分类):

   到了这里应该会遇到一个问题,就是模板中的仪表盘数据无法加载,那么将前面下载的grafana-peichart-panel插件拷贝至/var/lib/grafana/plugins/目录下,并 chmod 777 plugins(务必要做,我就因为这个气的吐血)

   7、如果一点数据都么有,那八成是模板的变量设置有问题,导致无法读取Prometheus的数据。我当初就做了点修改才有的数据,具体改了什么也记不清了,我把最终配置全贴出来供大家参考。修改变量的地方:点击上一页面右上角的小齿轮,在点击下图侧边栏的Variables就可以看到了。

   总共四个变量,如下图:

  $job变量配置:

                             

  $neo4j_instance变量配置:

                           

   $leader变量配置

                       

   由于几个月前搭建的,可能有些步骤会有遗漏,有问题可以评论哦。

   周五了,溜了溜了。

相关实践学习
通过可观测可视化Grafana版进行数据可视化展示与分析
使用可观测可视化Grafana版进行数据可视化展示与分析。
目录
相关文章
|
6天前
|
运维 Linux Apache
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
21 3
|
15天前
|
运维 监控 安全
高效运维管理:提升系统稳定性的策略与实践
【10月更文挑战第2天】 在当今数字化时代,运维管理成为企业IT部门的重要任务。本文将探讨如何通过高效的运维管理策略和最佳实践,提升系统的稳定性,确保业务持续平稳运行。通过分析常见问题、预防措施以及应对策略,我们将揭示高效运维的关键要素,助您打造一个可靠的IT环境。
|
4天前
|
运维 监控 安全
高效运维管理:提升系统稳定性的策略与实践
【10月更文挑战第13天】 本文探讨了高效运维管理的关键策略和实践,旨在帮助运维团队提升系统的稳定性。通过分析常见问题,提出具体的解决方案,包括监控与告警、自动化工具的应用、故障排查与恢复、性能优化以及安全防护等方面。通过这些策略和实践,可以帮助企业构建一个稳定、可靠且高效的IT系统。
27 1
|
13天前
|
运维 监控 安全
构建高效运维体系:从监控到自动化的全面指南在当今数字化时代,运维作为保障系统稳定性和效率的重要环节,其重要性不言而喻。本文将深入探讨如何构建一个高效的运维体系,从监控系统的搭建到自动化运维的实施,旨在为读者提供一套完整的解决方案。
本文详细介绍了高效运维体系的构建过程,包括监控系统的选择与部署、日志分析的方法、性能优化的策略以及自动化运维工具的应用。通过对这些关键环节的深入剖析,帮助运维人员提升系统的可靠性和响应速度,降低人工干预成本,实现业务的快速发展和稳定运行。
|
15天前
|
运维 Prometheus 监控
运维中的自动化实践每月一次的系统维护曾经是许多企业的噩梦。不仅因为停机时间长,更因为手动操作容易出错。然而,随着自动化工具的引入,这一切正在悄然改变。本文将探讨自动化在IT运维中的重要性及其具体应用。
在当今信息技术飞速发展的时代,企业对系统的稳定性和效率要求越来越高。传统的手动运维方式已经无法满足现代企业的需求。自动化技术的引入不仅提高了运维效率,还显著降低了出错风险。本文通过几个实际案例,展示了自动化在IT运维中的具体应用,包括自动化部署、监控告警和故障排除等方面,旨在为读者提供一些实用的参考。
|
22天前
|
运维 监控 大数据
高效运维管理:提升系统稳定性的策略与实践
在当今信息技术飞速发展的时代,运维管理作为保障系统稳定运行的关键环节,其重要性不言而喻。本文将深入探讨如何通过优化运维流程、引入自动化工具和建立完善的监控体系等策略,来有效提升系统的稳定性。同时,结合具体实践案例,分析这些策略在实际工作中的应用效果,为运维人员提供有益的参考和启示。
58 6
|
25天前
|
运维 负载均衡 监控
提升系统性能:高效运维的秘密武器——负载均衡技术
在当今数字化时代,系统的高可用性和高性能成为各类企业和组织追求的目标。本文旨在探讨负载均衡技术在运维工作中的关键作用,通过深入分析其原理、类型及实际应用案例,揭示如何利用这项技术优化资源分配,提高系统的响应速度和可靠性,确保用户体验的稳定与流畅。无论是面对突如其来的高流量冲击,还是日常的运维管理,负载均衡都展现出了不可或缺的重要性,成为现代IT架构中的基石之一。
38 4
|
1月前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
1月前
|
运维 监控 安全
高效运维管理:提升系统可靠性的策略与实践
本文将深入探讨高效运维管理的关键策略和实践,旨在帮助运维团队提高系统的可靠性、可用性和稳定性。通过分析常见的运维挑战,提出相应的解决方案,并结合实际案例进行说明,为读者提供一套行之有效的运维管理指南。无论是新手还是经验丰富的运维工程师,都能从中获得有价值的见解和实用技巧。
|
1月前
|
运维 Cloud Native Devops
云原生架构的崛起与实践云原生架构是一种通过容器化、微服务和DevOps等技术手段,帮助应用系统实现敏捷部署、弹性扩展和高效运维的技术理念。本文将探讨云原生的概念、核心技术以及其在企业中的应用实践,揭示云原生如何成为现代软件开发和运营的主流方式。##
云原生架构是现代IT领域的一场革命,它依托于容器化、微服务和DevOps等核心技术,旨在解决传统架构在应对复杂业务需求时的不足。通过采用云原生方法,企业可以实现敏捷部署、弹性扩展和高效运维,从而大幅提升开发效率和系统可靠性。本文详细阐述了云原生的核心概念、主要技术和实际应用案例,并探讨了企业在实施云原生过程中的挑战与解决方案。无论是正在转型的传统企业,还是寻求创新的互联网企业,云原生都提供了一条实现高效能、高灵活性和高可靠性的技术路径。 ##
116 3