业务监控:读取超过1秒,就会告警
hbase的请求量 大约13330.9 requests / second
20个节点的hbase集群, 重启其中一个datanode,有没有办法让业务不受影响,或者把影响降为最低。
如果下架datanode也会占用大量IO,读取超过1秒,也会告警
只重启一个datanode节点不会有太大影响的吧,毕竟有3备份机制
在重启的过程中确实会产生大量IO,如果这个IO也无法忍受,那可以考虑将数据先同步到一个备份集群,服务也指向那个备份集群,待主集群节点重启完之后再切换回来。
如果没有备份集群,也可以在重启之前先把balance_switch关闭,以减少重启过程中产生的大量IO,在重启完毕之后再把balance_switch打开。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。