云服务测评 | 基于云服务诊断全方位监管云产品

简介: 本文介绍了阿里云的云服务诊断功能,包括健康状态和诊断两大核心功能。作者通过个人账号体验了该服务,指出其在监控云资源状态和快速排查异常方面的优势,同时也提出了一些改进建议,如增加告警配置入口和扩大诊断范围等。

写在前面

在开始本文的测评之前,想先声明一下,这里我的账号是没有云服务器ECS的,因此本文按规则是不会参与评选的。但是作为对云产品比较热衷的技术人,个人还是想基于当前个人账号现有的资源来体验一下云服务诊断功能的功效,下面开始正文...

云服务诊断

在开始测评之前,先来了解一下什么是云服务诊断?也只有了解了这款云产品是什么,后面才知道应该用在哪儿。下面截取一段云服务诊断官方文档中的描述:【云服务诊断是面向客户运维工程师及开发者(以下简称为“用户”)提供的一款阿里云资源运维工具,包含「健康状态」和「诊断」两大核心功能。】(更多文档内容参考:https://help.aliyun.com/zh/management-console/what-is-cloud-service-diagnostics

简单的理解就是云服务诊断是一款针对阿里云资源提供的运维工具,可以通过这款工具直观的检测阿里云资源的健康状态,当发现健康状态有问题时,可以通过诊断功能来实时排查云资源发生异常状态的具体原因,并且可以根据云服务诊断提供的修复建议及时解决问题,快速恢复业务,保障系统的稳定运行。

健康状态

云资源健康状态个人理解就是说你已经购买的阿里云资源的运行状态, 当发生故障无法运行时,那么健康状态就是异常的,这个时候你可以联系阿里云工程师修复。如果云资源是正常状态,但是你的业务运行状态为异常,那么这种情况可以进一步检查配置,账号费用,云资源超限等问题。

云服务诊断服务的开通这里不再详细介绍,你可以点击控制台【运维监控】就会提示你开通云服务诊断。服务开通后你可以通过控制台首页查看当前账号下云资源健康状态。控制台首页地址:https://home.console.aliyun.com/home/dashboard/ProductAndService  查看到云资源健康状态

image.png


或者你也可以点击控制台首页的【运维监控】来查看云资源的健康状态,目前云资源没有异常状态

image.png

鼠标悬浮指向云产品的最新状态下的绿色对号,可以看到当前云资源的状态详细信息,点击【查看详情】可以查看云资源的详细信息

image.png

在点击【查看详情】页面我们看到的具体的云资源的状态信息

image.png

到这里,关于通过云服务诊断服务查看云资源状态的操作就算结束了,操作比较显而易见,也比较容易理解,方便企业运维人员或者开发人员可以实时监控云资源运行状态。这里有点疑惑就是我控制台首页命名有很多云资源,运维监控里面却只能看到部分云资源的运行状态,是因为其他云资源没有自动接入云服务诊断服务吗

image.png

诊断

诊断的话,个人理解就是云服务诊断服务提供了诊断工具,用户可以通过诊断工具,对运行异常状态的云资源实时发起诊断,等待1-2分钟完成诊断之后,会提供一个诊断报告,诊断报告会给出详细的异常描述以及修复建议,用户根据修复建议即可解决问题,快速恢复业务。在阿里云控制台可以通过侧边栏快速跳转到诊断页面

image.png


或者也可以通过运维监控页面的【创建诊断】功能来快速创建诊断功能

image.png

在创建诊断页面可以看到目前支持的云资源异常运行状态的场景信息,选择异常场景点击【下一步】

image.png

在弹框页面勾选协议,点击【一键开通】

image.png

开通完成后,在参数配置页面选择具体的实例后点击【开始诊断】

image.png

等待大约3分钟左右就可以完成对你选择的云资源的诊断操作,诊断完成后就可以看到具体的诊断信息了

image.png

如果云资源有异常信息的话,诊断过后会根据异常信息来提供具体的说明,就像如下的情况一样

测评总结

我是一位开发工程师,我平时工作 不经常涉及 云资源的运维和管理。

通过个人对于云服务诊断产品的健康状态和诊断功能的操作,我 理解了 健康状态和诊断的功能,我的疑惑是为什么控制台首页可以看到当前账号下32项云资源,

image.png

而在运维监控页面却只可以看到三项云资源的健康状态信息呢

image.png

这里我当前账号是个人账号,暂时没有ECS实例资源,目前可以看到的云资源的健康状态详情在上述文章中已经提供了,这里不再重复提供了。

我认为健康状态 有用 ,可以通过控制台的运维监控一目了然当前账号下的所有云资源产品的运行状态,方便运维或者开发人员快速获取云资源产品的健康状态,云资源产品的稳定运行也正是企业业务系统稳定运行的前提条件。

这里由于我的当前账号没有ECS实例,那么因此我诊断的是当前云服务诊断产品支持的弹性公网IP的诊断图片

我认为诊断 有用 ,通过创建诊断任务的形式,可以快速的诊断有异常的云资源产品,同时可以根据诊断报告中给出的问题分析,修复建议来快速的修复云资源异常问题,从而降低异常引起的业务运行中断时长,从而保证企业应用系统服务的稳定,为企业创造更多的价值。

此外,我还有点建议:

一方面我理解的是我的云资源有32项这么多,那么在【运维监控】页面的云资源健康状态也应该可以看到这么多的云资源产品的健康状态数据才对,目前我的账号只能看到如下的3项云资源的健康状态

image.png

另一方面就是说对于云服务诊断功能,目前的诊断能力涉及的云资源产品的范围属实有点太小了,除了大部分ECS问题的诊断之外,只剩下一少部分的云资源可以创建诊断任务来诊断异常信息了,很多其他的云资源并不支持诊断功能

image.png

还有一点就是说,既然是ECS服务诊断,为什么对于同一个云产品云服务器ECS,为什么诊断项却要分这么多,这样对于用户来说选择哪一个诊断项也是一件很头疼的事,毕竟对于云服务器ECS资源为什么会异常,用户或者说运维人员刚看到异常信息的时候并不能推测出是那方面的问题,这个时候如果逐项尝试诊断的话,还是很耽误时间的,希望可以改成每一项云资源就一个小方块,然后运维人员直接选择后,具体的诊断项的判断可以由云服务诊断自身功能来自动判断,并且给予诊断后的修复建议等内容

image.png

最后对于云资源健康状态还有点小建议就是说,是否可以在控制台运维监控页面的云资源健康状态列表后面增加一列,作为配置告警信息的入口,用户可以针对每一款云资源产品指定特定的告警人信息,包括但不限于钉钉、短信、邮件、微信等多种告警方式,方便运维人员在第一时间接受到云资源产品的异常告警信息,从而积极的做出响应,保证企业业务运行的稳定。

image.png


相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
8
10
0
1640
分享
相关文章
云产品评测 云服务诊断
作为一名开发工程师,我负责云资源的运维和管理。通过健康状态和诊断功能,可实时监控云资源(如ECS、网站等)的运行情况,快速排查并解决诸如访问异常、配置错误、安全风险等问题。诊断工具简化了问题定位流程,提供详细的修复建议,帮助用户在1-2分钟内完成诊断,迅速恢复业务。健康状态页面展示各实例的每小时健康数据,支持查看15天内的历史记录,极大提升了问题排查效率。
206 98
产品评测 | 安全体检为您的云上资源保驾护航
作为一名运维开发工程师,我使用了阿里云的安全体检工具,该工具免费提供病毒攻击、风险配置、服务器漏洞三方面的检测。通过体检,我发现7条安全风险,如RAM用户密码策略简单、ECS实例绑定公网IP及安全组端口配置不当。针对这些问题,我进行了修复,如加强密码策略和调整安全组设置。体检结果帮助我及时发现并解决潜在的安全隐患,提升了云上资产的安全水平。建议增加自定义忽略规则、一键处理等功能,进一步优化用户体验。总体而言,阿里云安全体检适合中小企业和个人开发者,提供了全面且集成的安全检测服务。
老周的云服务诊断测评
作为一名后端研发工程师,我体验了阿里云的云服务诊断工具,该工具涵盖计算、网络、数据库等多种诊断场景,提供针对性的诊断流程和实时健康状态反馈。然而,针对私有云和多云环境的支持仍有提升空间,建议增加主备域名实时切换、多云支持及更全面的应用健康检查功能。
150 71
云服务风险慨述
从用户角度来看,云计算意味着数据、计算及应用均通过网络被转移到用户掌控范围之外的云服务提供商手中,因此,用户隐私信息和云服务风险等问题随之而来。从技术层面来看,传统信息安全存在的问题在云端上同样存在,而且还因为云计算的商业模式及虛拟化等技术的引入,使得云服务面临新的服务风险问题。
2027 0
云服务诊断体验测评
一文带你了解云服务诊断产品的优与劣
143 39
云产品评测|云服务诊断
云服务诊断是阿里云提供的运维工具,帮助用户快速定位和解决云资源问题。通过“健康状态”和“诊断”两大核心功能,用户可以实时查看云资源的运行状况,并对常见问题(如网站无法访问、ECS故障等)进行自动排查,获取修复建议。这大大提高了问题解决效率,减少了排查时间。此外,还提供了优化建议,如增加历史趋势分析、智能预测等功能,进一步提升用户体验。
61 2
云服务诊断测评报告
作为一名开发工程师,我日常负责云资源的运维与管理,尤其注重监控核心云资源状态以规避风险 通过云服务诊断涵盖健康状态和诊断两大核心功能能够有效提升我们的工作效率
阿里云云服务诊断工具测评
阿里云云服务诊断工具测评
63 7
如何评估云服务提供商?
【6月更文挑战第21天】如何评估云服务提供商?
179 3
云计算与网络安全:探索云服务中的信息安全策略
【10月更文挑战第39天】随着云计算的飞速发展,越来越多的企业和个人将数据和服务迁移到云端。然而,随之而来的网络安全问题也日益突出。本文将从云计算的基本概念出发,深入探讨在云服务中如何实施有效的网络安全和信息安全措施。我们将分析云服务模型(IaaS, PaaS, SaaS)的安全特性,并讨论如何在这些平台上部署安全策略。文章还将涉及最新的网络安全技术和实践,旨在为读者提供一套全面的云计算安全解决方案。