我是一位项目经理(兼产品经理),我平时工作 涉及云资源的运维和管理。我 理解了健康状态和诊断的功能
我的疑惑是:
我看使用手册上对【健康状态】有定义:
健康状态指云资源的可用性状态:不可用为异常,可用为正常。
云资源:云产品每一个可独立管理及运行的实例或服务统称为一个云资源,如ECS的每一个实例、OSS的每一个bucket。
不可用定义:
因阿里云原因(如故障、计划内维护变更等)导致客户某个云资源在某个时段完全不响应用户正常请求(如宕机、完全无法连通、全部返回5xx或不返回等)或服务可用性低于正常波动范围(根据服务特点而定),则认为该云资源在该时段内服务不可用。(因为云产品较多,差异较大,不同云产品在不可用定义上可能存在差别,判断标准也有所不同。
也就是说健康状态只是说明可用和不可用两种状态,在我使用产品的时候,其实跳转到【健康】切页查看会比较少,更多的直接在控制台查看,如下图:我的产品健康状态都是正常健康的,但实际有台服务器是存在漏洞,所以健康状态单独来看并不能说产品真的使用健康,而是说可用,我个人觉得应该在健康状态里面把存在风险的问题也显示出来,单从健康状态来做运维判断会导致风险加大(当然我也理解目前的健康状态是最基础的检测,进一步诊断才能查看到是否有风险,是否会进一步处理,但是有些懒惰的情况下说的极端端,很可能一看健康的就不管了,这会导致风险未处理)
图一:健康状态的截图:
图二:控制台的资源安全防护评分:
同时我对【诊断功能】进行了体验,诊断功能相对效率还是挺高的,功能涉及的面也是很广泛,如下图:(这里我选择了我的一台服务器实例进行诊断:因为我知道这台服务器有漏洞)
在进行【诊断】的时候,我觉得速度效率还是挺快的,检测内容也比较准确,这里检测到我的服务器问题是:异常的注册表项 2024-12-11 10:11:03 检测模型发现您服务器上的某个注册表配置项可疑,恶意软件常常会修改某些关键注册表配置来持久化运行或干扰正常的安全防护。
刚开始我以为诊断出来了就能直接在本页面进行处理,比如给出【一键修复】或者是【修复建议】,但是没有,最后还是需要跳转到安全中心去处理和查看具体的漏洞内容。
另外这里我稍微补充个问题:我在【控制台】安全与合规的评分是87分,而在云安全中心的评分是70分,从结果判断上来看,我觉是【控制台】的安全与合规出存在数据未刷新的情况,希望这里的评分能够及时刷新。
下图是控制台的安全与合规:
下图是云安全中心:
我认为健康状态 有用 ,解决了 快速查看资源是否可用的情况,但是又不是很有用,就好比“一个人是不是还活着,如果活着就是有用,但是这个人如果病了或者是状态不佳了他这没有提现”,当然也可能是我评测没到位,但是我个人体验上来说,我希望是健康状态能把异常问题也大概的罗列下,就好比云安全中心一样。
我认为诊断 有用 ,解决了快速针对性的问题查询,比如针对性的对某个模块进行精准的排查效率还是高的,不过这也仅仅是诊断,相关的处理意见还是得跳到云安全中心,我日常还是直接使用云安全中心扫描检测处理感觉比较快。(当然我是用个人帐号进行体验,如果是企业帐号生产环境下是挺好的)。