通过ECS诊断服务自助解决实例、安全组等相关操作行为审计问题

简介: 用户在使用ECS云服务器时,有时会出现各种各样关于资源操作的疑惑,不知何时发生的这些操作。如果用户自己没有完善的日志审计,就很容易不知所措,此时只能提交工单由阿里云的人工服务帮助排查,因提交工单排查需要一定的时间和人力资源投入,所以用户需要等待一段时间,因而一定程度上会降低问题解决的效率,阿里云ECS团队推出用户操作记录的日志行为回溯功能,帮助用户快速自主查询和解决问题,提高工作效率。

介绍

ECS云服务器是用户使用最多的云资源之一,但有时会出现一些问题而变得不知所措:网络不通,发现实例不知何时加入了一个安全组;账号下面不知何时多出/少了几个ECS实例;实例的一些费用不知道为什么突然激增;实例不知何时被启动或关停。如果没有完备的日志审计,这些问题就会很容易产生疑惑,此时只能求助阿里云人工服务,在阿里云小二排查了一段时间后,通常可以给到用户答复,但这中间会花费一些的时间,延缓用户问题的解决速度。阿里云ECS团队推出了关于实例、费用、安全组相关的操作日志审计功能,帮助用户快速自主查询,提高问题的解决速度。

目前主要包括的功能:

  • 排查用户非预期的实例创建或释放记录
  • 排查用户非预期的实例状态变化记录
  • 排查用户非预期的创建或删除安全组记录
  • 排查用户实例的安全组配置被修改记录
  • 排查用户实例计费变更记录

使用方式

使用前提条件:为了让诊断系统可以使用用户的角色去查询操作记录,因此在RAM访问控制中,需要用户拥有AliyunRAMFullAccess权限,并关联了AliyunServiceRoleForECSSelfService角色。详细操作请参见《管理实例问题排查诊断服务的关联角色》。

针对以下场景

  • 排查用户非预期的实例创建或释放记录
  • 排查用户非预期的实例状态变化记录
  • 排查用户实例的安全组配置被修改记录
  • 排查用户实例计费变更记录

如下图所示,进入阿里云ECS控制台,在功能列表中选择“自助问题排查”,然后选择实例问题排查 > 实例费用及安全行为审计 > 选择对应上述的问题场景,然后选择一个需要诊断的实例,选择一个诊断时间段,诊断系统便会对这个实例进行所选时间范围内的操作记录搜索。

image.png

针对以下场景

  • 排查用户非预期创建或删除安全组记录

操作和前述场景大同小异,如下图所示,进入阿里云ECS控制台,在功能列表中选择“自助问题排查”,然后选择实例问题排查 > 实例费用及安全行为审计 > 非预期创建或删除安全组,然后选择一个需要诊断的安全组,选择一个诊断时间段,诊断系统便会对这个安全组进行所选时间范围内的操作记录搜索。

image.png


诊断结果

针对以下场景

  • 排查用户非预期的实例创建或释放记录
  • 排查用户非预期的实例状态变化记录
  • 排查用户实例的安全组配置被修改记录
  • 排查用户实例计费变更记录

在查询操作记录完成后,会显示查询结果,下图所示为查询到指定时间范围内操作记录的结果,点击“操作记录”超链接,则会跳转ECS实例的操作记录页面。

image.png


在实例操作记录页面里,可以看到下方展示的列表,列表内展示的是对应场景的操作记录,主要包括的信息有:操作名称,操作类型,关联资源ID,用户名,操作时间等等。下图所示的实例创建和释放的场景里,可以看到一次RunInstances的操作及其相关的记录信息。在示意图的脑图中可以看到几个用户行为回溯的场景,包括实例创建和释放,实例启动和关停,实例计费变更,关联安全组变更。在不同的诊断场景下都会按照诊断条件跳转至对应的实例操作记录场景以查看结果。

image.png


针对以下场景

  • 排查用户非预期创建或删除安全组记录

这些场景会在诊断结果页面直接展示操作记录,主要信息包括:操作名称,操作时间,操作类型,操作来源。如果用户希望查询更详细的操作信息,可以通过超链接“操作审计”跳转至云产品ActionTrail进行高级搜索和查询。

image.png

诊断系统的诊断项介绍

五类场景主要包含的API和ECS控制台操作如下:

  • 排查用户非预期的实例创建或释放记录

RunInstances(创建实例)

CreateOrder(创建实例)

CreateInstance(创建实例)

ModifyInstanceAutoReleaseTime(修改实例到期时间)

DeleteInstances(删除实例)

DeleteInstance(删除实例)

  • 排查用户非预期的实例状态变化记录

RunInstances(创建并启动实例)

StartInstance(启动实例)

StartInstances(启动实例)

StopInstance(停止实例)

StopInstances(停止实例)

RebootInstance(重启实例)

RebootInstances(重启实例)

ReactivateInstances(重启实例)

  • 排查用户非预期的创建或删除安全组记录

CreateSecurityGroup(创建安全组)

DeleteSecurityGroup(删除安全组)

  • 排查用户实例的安全组配置被修改记录

JoinSecurityGroup(加入安全组)

LeaveSecurityGroup(离开安全组)

RunInstances(创建实例并加入安全组)

CreateOrder(创建实例并加入安全组)

CreateInstance(创建实例并加入安全组)

  • 排查用户实例计费变更记录

RunInstances(创建实例)

CreateOrder(创建实例)

StartInstance(启动实例)

StartInstances(启动实例)

RenewInstance(启动实例)

ModifyInstanceAutoRenewAttribute(修改实例到期时间)

ModifyInstanceAttribute(修改实例属性,主要是修改突发性能实例的运行模式)

ModifyInstanceChargeType(修改实例付费类型)

ModifyInstanceSpec(修改实例规格)

ModifyPrepayInstanceSpec(修改实例规格)

ModifyInstanceNetworkSpec(修改实例带宽)

ReactivateInstances(重启实例)

后续还有其他的诊断项会陆续发布,例如安全组规则变化记录查询,磁盘操作记录查询等等。如果您有比较急迫的其他诊断需求,也可以联系我们

工作原理

用户发起诊断后,系统会先检查用户是否拥有AliyunRAMFullAccess权限,如果没有此权限则无法进行诊断。权限校验通过后会提示用户关联诊断服务的AliyunServiceRoleForECSSelfService角色,若用户同意则系统为用户自动进行关联,此角色可以在用户发起操作记录查询时,使用用户的身份去云产品ActionTrail查询用户的操作记录。在查询完相关场景的操作记录后,系统将筛选后符合条件的结果返回给用户。

image.png


已开放地域

目前实例启动异常诊断的能力已经通过ECS控制台在阿里云全球所有地域向所有用户开放。

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6天前
|
弹性计算 监控 负载均衡
|
4天前
|
弹性计算 人工智能 数据安全/隐私保护
【手把手教你】如何免费畅快使用阿里云ECS搭建私有Overleaf论文写作服务
本文详细介绍如何利用阿里云ECS免费搭建私有Overleaf论文写作服务,包括ECS服务器的部署、Overleaf服务的安装、TexLive包的更新、XeLaTeX修复、中文字体支持及账号管理等步骤。通过这些操作,你可以实现免费且高效的多人协作论文写作,避免付费版本的高昂费用。适合需要频繁合作撰写论文的团队使用。
32 1
【手把手教你】如何免费畅快使用阿里云ECS搭建私有Overleaf论文写作服务
|
3天前
|
存储 缓存 安全
阿里云服务器内存型r7、r8a、r8y、r8i实例区别及选择参考
随着阿里云2024年金秋云创季的开始,目前在阿里云的活动中,属于内存型实例规格的云服务器有内存型r7、内存型r8a、内存型r8y和内存型r8i这几个实例规格,相比于活动内的经济型e和通用算力型u1等实例规格来说,这些实例规格等性能更强,虽然这几个实例规格的云服务器通常处理器与内存的配比为都是1:8,但是他们在处理器、存储、网络、安全等方面等性能并不是一样的,所以他们的适用场景也有着不同。本文为大家介绍内存型r7、r8a、r8y、r8i实例的性能、适用场景的区别以及选择参考。
|
6天前
|
机器学习/深度学习 弹性计算 编解码
阿里云服务器c7/c8a/c8y/c8i/g7/g8a/g8y/g8i/r7/r8a/r8y/r8i实例区别及选择参考
在阿里云目前的活动中,除了特价的轻量应用服务器和经济型e及通用算力型u1实例之外,属于计算型实例的实例有计算型c7/c8a/c8y/c8i,属于通用型实例的有通用型g7/g8a/g8y/g8i,属于内存型实例的有内存型r7/r8a/r8y/r8i。本文将详细介绍阿里云服务器中的c7、c8a、c8y、c8i、g7、g8a、g8y、g8i、r7、r8a、r8y、r8i等实例规格的性能、适用场景及选择参考,帮助用户更好地选择合适的云服务器实例。
|
9天前
|
存储 机器学习/深度学习 编解码
阿里云服务器计算型c7、c8a、c8y、c8i实例性能、适用场景区别及选择参考
随着阿里云2024年金秋云创季的开始,目前在阿里云的活动中,属于计算型实例规格的云服务器有计算型c7、计算型c8a、计算型c8y和计算型c8i这几个实例规格,相比于活动内的经济型e和通用算力型u1等实例规格来说,这些实例规格等性能更强,虽然这几个实例规格的云服务器通常处理器与内存的配比为都是1:2,但是他们在处理器、存储、网络、安全等方面等性能并不是一样的,所以他们的适用场景也有着不同。本文为大家介绍计算型c7、c8a、c8y、c8i实例的性能、适用场景的区别以及选择参考。
|
8天前
|
存储 人工智能 安全
阿里云服务器通用型g7、g8a、g8y、g8i实例区别及选择指南
目前在阿里云的活动中,属于通用型实例规格的云服务器有通用型g7、通用型g8a、通用型g8y和通用型g8i这几个实例规格,相比于活动内的经济型e和通用算力型u1等实例规格来说,这些实例规格等性能更强,虽然这几个实例规格的云服务器通常处理器与内存的配比为都是1:4,但是他们在处理器、存储、网络、安全等方面等性能并不是一样的,所以他们的适用场景也有着不同。本文为大家介绍通用型g7、g8a、g8y、g8i实例的性能、适用场景的区别以及选择参考。
|
10天前
|
Linux 数据库
Linux服务如何实现服务器重启后的服务延迟自启动?
【10月更文挑战第25天】Linux服务如何实现服务器重启后的服务延迟自启动?
58 3
|
15天前
|
存储 安全 网络协议
阿里云服务器通用型g7、通用型g8y、通用型g8i实例性能和适用场景对比与选择参考
目前阿里云在售的云服务器中,主要包含了第6代、第7代、第8代实例规格的云服务器产品,在选择云服务器实例规格时,对于需要平衡计算、存储和网络性能的应用场景来说,通用型g7、通用型g8y和通用型g8i实例是许多用户的热门选择。为了帮助大家更好地了解这三款实例的区别,并为选择提供参考,本文将详细对比它们的实例规格、CPU、内存、计算、存储、网络等方面的性能,并附上活动价格对比。让大家了解一下他们之间的不同,以供参考选择。
|
6天前
|
弹性计算
阿里云2核16G服务器多少钱一年?亲测价格查询1个月和1小时收费标准
阿里云2核16G服务器提供多种ECS实例规格,内存型r8i实例1年6折优惠价为1901元,按月收费334.19元,按小时收费0.696221元。更多规格及详细报价请访问阿里云ECS页面。
39 9
|
3天前
|
监控 Ubuntu Linux
使用VSCode通过SSH远程登录阿里云Linux服务器异常崩溃
通过 VSCode 的 Remote - SSH 插件远程连接阿里云 Ubuntu 22 服务器时,会因高 CPU 使用率导致连接断开。经排查发现,VSCode 连接根目录 ".." 时会频繁调用"rg"(ripgrep)进行文件搜索,导致 CPU 负载过高。解决方法是将连接目录改为"root"(或其他具体的路径),避免不必要的文件检索,从而恢复正常连接。