使用蓝鲸自愈平台完成java项目程序的自愈机制

简介: 使用蓝鲸自愈平台完成java项目程序的自愈机制1.蓝鲸自愈平台故障自愈是行业领先的"故障自动化处理"解决方案,提升企业的服务可用性和降低故障处理的人力投入,实现故障自愈从"人工处理"到"无人值守"的变革!自愈平台可以根据连接配置好的监控平台,当收到我们指定要自愈的监控告警时,首先筛选出告警信息的ip地址,再匹配该服务器所在的集群节点,确认服务器信息,然后将服务器地址传到对应的作业平台的某个作业里,通过作业的具体恢复脚本,实现项目的故障资源机制。

使用蓝鲸自愈平台完成java项目程序的自愈机制

1.蓝鲸自愈平台

官方文档

故障自愈是行业领先的"故障自动化处理"解决方案,提升企业的服务可用性和降低故障处理的人力投入,实现故障自愈从"人工处理"到"无人值守"的变革!

自愈平台可以根据连接配置好的监控平台,当收到我们指定要自愈的监控告警时,首先筛选出告警信息的ip地址,再匹配该服务器所在的集群节点,确认服务器信息,然后将服务器地址传到对应的作业平台的某个作业里,通过作业的具体恢复脚本,实现项目的故障资源机制。

实现步骤:

首先配置一个告警源

准备故障资源的作业平台脚本

然后配置一个自愈套餐,调用作业平台

最后接入自愈

2.配置告警源

在菜单 [接入自愈] -> [管理告警源] 中,点击 启用 Zabbix。

跳转到接入流程页面

登陆zabbix服务器操作以下步骤

cd /usr/lib/zabbix/alertscripts
wget 'http://${PaaS_Host}/o/bk_fta_solutions/0/alarm_source/scripts/zabbix_fta_alarm.py?fta_application_id=66fdfe50-3075-49bf-8101-d97386030c9b&fta_application_secret=EfgBbXD25N6870j9nkgf3ns8eOEsH2Sk' -O /usr/lib/zabbix/alertscripts/zabbix_fta_alarm.py --no-check-certificate
chmod  +x zabbix_fta_alarm.py
./zabbix_fta_alarm.py --init http://${Zabbix_Host}/api_jsonrpc.php  Admin zabbix

该脚本会创建一个名为FTA_Event_Handler的 报警媒介,名为 FTA_Act 的 Action,名为 FTA_Mgr 的用户。

3.新建一个作业平台

点击作业执行—>新建作业—>填写作业名称—>填写脚本内容

脚本内容如下

#!/bin/bash
anynowtime="date +'%Y-%m-%d %H:%M:%S'"
NOW="echo [\`$anynowtime\`][PID:$$]"
##### 可在脚本开始运行时调用,打印当时的时间戳及PID。
function job_start
{
    echo "`eval $NOW` job_start"
}
##### 可在脚本执行成功的逻辑分支处调用,打印当时的时间戳及PID。 
function job_success
{
    MSG="$*"
    echo "`eval $NOW` job_success:[$MSG]"
    exit 0
}
##### 可在脚本执行失败的逻辑分支处调用,打印当时的时间戳及PID。
function job_fail
{
    MSG="$*"
    echo "`eval $NOW` job_fail:[$MSG]"
    exit 1
}
job_start
###### 可在此处开始编写您的脚本逻辑代码
###### 作业平台中执行脚本成功和失败的标准只取决于脚本最后一条执行语句的返回值
###### 如果返回值为0,则认为此脚本执行成功,如果非0,则认为脚本执行失败
#输出告警信息
echo "告警信息:`echo $1`"
echo $1
#输出自愈机器IP
ip=`ifconfig |grep 192.168 | awk '{print $2}' |awk -F ':' '{print $2}'`
echo "自愈机器IP: ${ip}"
#指定tomcat所在路径
tomcat_path=/data/tomcat
#剩余内存容量
free_memory=`free  -g | grep Mem | awk '{print $4}'`
echo "服务器剩余内存:${free_memory} GB"
#要自愈的tomcat名称
tomcat_name=`echo $1 | awk '{print $1}'`
#输出当前tomcat服务所使用的端口号
port=`grep 'Connector port=' ${tomcat_path}/${tomcat_name}/conf/server.xml  | grep 'protocol="HTTP/1.1"' | egrep -o "[0-9]{4,5}"`
echo "服务端口:${port}"
#自愈项目
if [[ "$ip" == "192.168.5.91" ]] || [[ "$ip" == "192.168.5.92" ]];then
  echo "开始重启${tomcat_name}"
  #ps aux | grep ${tomcat_name} | grep -v grep | awk '{print \$2}' | xargs kill -9
    ${tomcat_path}/${tomcat_name}/bin/startup.sh
  sleep 10s
fi
#检查项目是否启动成功
for i in {1..20}
do
    sleep 3s
    echo "第$i次尝试"
    ava=`curl curl -s http://${ip}:${port}/test_ping`
    if [[ "$ava" = "true" ]];then
        echo "${tomcat_name}自愈成功"
        break
    fi
    if [ $i -ge 20 ];then
        echo "项目自愈不成功!!!"
        exit 1
    fi
done

4.新建一个自愈套餐

按下图填写

5.接入自愈

目录
相关文章
|
25天前
|
开发框架 Java API
java反射机制的原理与简单使用
java反射机制的原理与简单使用
17 1
|
7天前
|
Java Maven
【Java报错】显示错误“Error:java: 程序包org.springframework.boot不存在“
【Java报错】显示错误“Error:java: 程序包org.springframework.boot不存在“
30 3
|
25天前
|
人工智能 监控 算法
java智慧城管源码 AI视频智能分析 可直接上项目
Java智慧城管源码实现AI视频智能分析,适用于直接部署项目。系统运用互联网、大数据、云计算和AI提升城市管理水平,采用“一级监督、二级指挥、四级联动”模式。功能涵盖AI智能检测(如占道广告、垃圾处理等)、执法办案、视频分析、统计分析及队伍管理等多个模块,利用深度学习优化城市管理自动化和智能化,提供决策支持。
146 4
java智慧城管源码 AI视频智能分析 可直接上项目
|
4天前
|
JavaScript Java 测试技术
基于Java的家政公司服务平台的设计与实现(源码+lw+部署文档+讲解等)
基于Java的家政公司服务平台的设计与实现(源码+lw+部署文档+讲解等)
20 1
|
8天前
|
JavaScript Java 测试技术
基于Java的智能实时疫情监管服务平台的设计与实现(源码+lw+部署文档+讲解等)
基于Java的智能实时疫情监管服务平台的设计与实现(源码+lw+部署文档+讲解等)
21 0
|
8天前
|
JavaScript Java 测试技术
基于Java的网上茶叶销售平台的设计与实现(源码+lw+部署文档+讲解等)
基于Java的网上茶叶销售平台的设计与实现(源码+lw+部署文档+讲解等)
20 0
|
10天前
|
SQL Java Go
java项目超市购物管理系统
java项目超市购物管理系统
|
13天前
|
安全 Java 调度
深入理解Java中的线程安全与锁机制
【4月更文挑战第6天】 在并发编程领域,Java语言提供了强大的线程支持和同步机制来确保多线程环境下的数据一致性和线程安全性。本文将深入探讨Java中线程安全的概念、常见的线程安全问题以及如何使用不同的锁机制来解决这些问题。我们将从基本的synchronized关键字开始,到显式锁(如ReentrantLock),再到读写锁(ReadWriteLock)的讨论,并结合实例代码来展示它们在实际开发中的应用。通过本文,读者不仅能够理解线程安全的重要性,还能掌握如何有效地在Java中应用各种锁机制以保障程序的稳定运行。
|
18天前
|
Java 程序员 开发者
深入理解Java异常处理机制
在Java编程中,异常处理是确保程序健壮性与稳定性的重要组成部分。本文旨在深度剖析Java异常处理机制的核心概念、结构及其实际应用策略,帮助开发者更好地理解并运用异常处理来优化程序设计。我们将从Java异常体系结构入手,探讨try-catch-finally语句块的执行流程,分析自定义异常的必要性与实现方式,并通过实例演示如何有效地管理和处理异常情况。
23 3
|
22天前
|
Java Maven
运行maven项目出现Error:java: JDK isn‘t specified for module ‘XXX‘
运行maven项目出现Error:java: JDK isn‘t specified for module ‘XXX‘
11 0