ChaosBlade识别问题之无法识别或重启Pod如何解决

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
可观测链路 OpenTelemetry 版,每月50GB免费额度
注册配置 MSE Nacos/ZooKeeper,118元/月
简介: ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:

问题一:ChaosBlade卸载注册的探针 重新注册可以识别到。但是我觉得这是一个问题,想了解下怎么处理?


ChaosBlade卸载注册的探针 重新注册可以识别到。但是我觉得这是一个问题,是必现的,想了解下怎么处理?


参考回答:

代码在这里 https://github.com/chaosblade-io/chaosblade-box-agent/tree/main/collector/kubernetes  ,我看了下写的有点复杂,直接用 Informer 应该会简单很多


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/596520?spm=a2c6h.13066369.question.36.2345f653mC9ZaQ



问题二:ChaosBlade无法识别重启或新建的Pod,请问大家怎么解决呢?


ChaosBlade无法识别重启或新建的Pod,请问大家怎么解决呢?版本:

chaosblade-box:1.0.3

chaosblade-agent:1.0.2

k8s :1.25

其他

1.使用社区helm方式部署在k8s

2.查看chaosblade各组件log均正常,未发现异常报错日志

3.k8s探针注册正常在线

问题描述

待被故障注入的pod在重启或新建后,chaosblade无法识别到(等待1h也没有识别)


参考回答:

重启下 agent 试试


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/596519?spm=a2c6h.13066369.question.37.2345f653yzXAHy



问题三:ChaosBlade各位混沌工程能做带宽限制吗?我看了下指令好像没有这块的?


ChaosBlade各位混沌工程能做带宽限制吗?我看了下指令好像没有这块的?


参考回答:

还没


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/596518?spm=a2c6h.13066369.question.38.2345f653nwEzOO



问题四:ChaosBlade中k8s pod跑的java应用,直接操作就可以了吗?


ChaosBlade中k8s pod跑的java应用,用chaosblade-box 操作,直接操作就可以了吗?


参考回答:

是从box下发命令,但要保证你的整个链路是通畅的,最终copy到应用容器下的执行器会执行命令


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/596515?spm=a2c6h.13066369.question.39.2345f653nPVggk



问题五:chaosblade-box 部署后web页面访问频繁返回500


我在一台离线服务器上部署chaosblade-box,

安装官方文档指导,部署了ansible,expect,mysql,准备了java 环境(1.8.0-292),部署的chaosblade-box 的版本是 1.0.0。

在启动之后,在 web 页面访问,频繁返回 500报错。

查看 log,先是报错了

“org.quartz.JobPersistenceException: Couldn't store trigger 'DEFAULT.1753259054709309442_trigger' for 'DEFAULT.1753259054709309442' job:Table 'chaosblade.t_chaos_m_quartz_paused_trigger_grps' doesn't exist”

后面继续报错

"

Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception [Request processing failed; nested exception is com.alibaba.chaosblade.box.common.infrastructure.exception.PermissionDeniedException] with root cause

com.alibaba.chaosblade.box.common.infrastructure.exception.PermissionDeniedException: null

"

按照之前的提问,从启动配置,java 依赖,log 查找异常,但没有结果,请帮忙看看我这个问题的原因?如何解决?


参考回答:

根据您提供的信息,这个问题可能是由于数据库表不存在导致的。您可以尝试以下步骤来解决这个问题:

1. 登录到MySQL数据库,执行以下命令创建缺失的表:

CREATE TABLE `chaosblade`.`t_chaos_m_quartz_paused_trigger_grps` (
  `SCHED_NAME` varchar(120) NOT NULL,
  `TRIGGER_GROUP` varchar(200) NOT NULL,
  PRIMARY KEY (`SCHED_NAME`,`TRIGGER_GROUP`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

1. 重启Chaosblade-box服务,查看是否仍然出现500错误。

如果问题仍然存在,请检查您的配置文件和日志,确保所有设置都是正确的。如果仍然无法解决问题,建议您联系Chaosblade-box的技术支持寻求帮助。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/595441?spm=a2c6h.13066369.question.40.2345f653QBNQqm

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
6月前
|
关系型数据库 MySQL 测试技术
ChaosBlade常见问题之页面没有机器列表权限不能执行故障注入如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
|
6月前
|
测试技术 API 容器
|
1月前
|
Kubernetes Docker Perl
k8s常见故障--yaml文件检查没有问题 pod起不来(一直处于创建中)
k8s常见故障--yaml文件检查没有问题 pod起不来(一直处于创建中)
|
3月前
|
Kubernetes Docker Perl
在K8S中,如果是因为开发写的镜像问题导致pod起不来该怎么排查?
在K8S中,如果是因为开发写的镜像问题导致pod起不来该怎么排查?
|
3月前
|
Kubernetes 负载均衡 网络协议
在K8S中,Pod的探针有哪些及用途?
在K8S中,Pod的探针有哪些及用途?
|
3月前
|
Kubernetes Java 调度
在K8S中,Pod突然挂掉,K8S有什么机制或功能自动清除Pod?
在K8S中,Pod突然挂掉,K8S有什么机制或功能自动清除Pod?
|
3月前
|
Kubernetes 监控 Shell
在K8S中,我们公司用户反应pod连接数非常多,希望看一下这些连接都是什么信息?什么状态?怎么排查?容器里面没有集成bash环境、网络工具,怎么处理?
在K8S中,我们公司用户反应pod连接数非常多,希望看一下这些连接都是什么信息?什么状态?怎么排查?容器里面没有集成bash环境、网络工具,怎么处理?
|
4月前
|
Kubernetes Linux 调度
k8s环境设置-pod下载及重启策略
k8s环境设置-pod下载及重启策略
49 1
|
6月前
|
Ruby Perl
工程支持xcframework,检查pod版本及更新pod
工程支持xcframework,检查pod版本及更新pod
64 0
|
6月前
|
SQL Kubernetes Java
ChaosBlade常见问题之agent-pod 一直在重启如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集: