开发者社区> 问答> 正文

如何排查伸缩活动异常?

弹性伸缩如何排查伸缩活动异常?

展开
收起
小天使爱美 2020-03-22 00:46:39 3980 0
2 条回答
写回答
取消 提交回答
  • 专注在大数据分布式计算、数据库及存储领域,拥有13+年大数据引擎、数据仓库、宽表引擎、平台研发经验,6年云智能大数据产品技术一号位经验,10年技术团队管理经验;云智能技术架构/云布道师; 研发阿里历代的大数据技术产品包括ODPS、DLA、ADB,最近五年主导宽表引擎研发、DLA、ADB湖仓研发;

    一般需要有监控的服务,设定一定的预期,后续检测是否符合预期。

    一般情况下,弹性伸缩都有一定的度,比如min ~ max ,如果不在此区间视为异常。

    2020-03-22 11:44:44
    赞同 展开评论 打赏
  • 执行伸缩活动时,可能因一些原因导致异常,无法成功完成。本文列出了常见的控制台说明信息,并给出原因和解决建议。

    背景信息 伸缩活动异常包括伸缩活动被拒绝和伸缩活动执行失败,您可以参考查看伸缩活动了解相关的状态信息或详细信息。

    伸缩活动被拒绝 如果伸缩活动被拒绝,您可以从状态信息了解原因,并采取对应的解决方案,如下表所示:

    伸缩活动状态信息 原因及建议 DBInstanceIdentifier does not refer to an existing DB instance.(xxxx) 原因:RDS实例不存在。 建议:请确保伸缩组关联的RDS实例已存在。

    The current status of the load balancer xxxxx does not support this action. 原因:负载均衡实例状态不是active。 建议:请确保伸缩组关联的负载均衡实例处于正常工作的状态。

    To execute the specified scaling rule, the total capacity will not change. 原因:伸缩组内的实例数不能小于伸缩组设置的最小值,也不能大于伸缩组设置的最大值,执行此伸缩规则将导致伸缩组内实例小于最小值或大于最大值,因此拒绝执行。 建议:请检查目前实例数量或伸缩规则配置,确保执行伸缩规则后不会超出实例数量限制。

    The current status of DB instance xxxxx does not support this action. 原因:RDS实例状态异常,暂不支持执行伸缩活动。 建议:如果伸缩组关联的RDS实例处于迁移状态,建议登录RDS控制台确认实例状态处于正常工作状态,然后重新执行伸缩活动。

    You cannot delete a scaling group or launch a new scaling activity while there is scaling activity in progress for the specified scaling group. 原因:当前伸缩组有正在执行的伸缩活动。 建议:请等待当前的伸缩活动运行完成,然后执行新的伸缩活动。

    You cannot launch a new scaling activity during the cooldown period. 原因:伸缩组处于冷却时间,伸缩活动被拒绝执行。 建议:需要等待冷却时间结束,具体说明请参考冷却时间。

    The current status of the specified scaling group does not support this action. 原因:当期伸缩组状态不支持此操作,伸缩组可能为停用状态或者删除中状态。 建议:如果伸缩组为停用状态,请先启用伸缩组。

    The specified SecurityGroupId does not exist. 原因:伸缩配置对应的安全组不存在。 建议:请修改伸缩配置,设置对应的安全组。

    To remove the instances, the total capacity will be lesser than the min size. 原因:伸缩组内的实例数不能小于伸缩组设置的最小值,如果移除伸缩组内现有的实例,会导致伸缩组内实例数小于伸缩组最小值,因此被拒绝执行。 建议:请检查目前实例数量或伸缩规则配置,确保执行伸缩规则后不会超出实例数量限制。

    The specified LoadBalancerId does not exist. 原因:负载均衡实例不存在。 建议:请确保伸缩组关联的负载均衡实例已存在,伸缩组中设置负载均衡实例详情可参考在弹性伸缩中使用负载均衡服务。

    Ess should be authorized in ram to operate user resource. 原因:主账号未授权当前子账号操作弹性伸缩服务相关资源。 建议:请登录访问控制控制台授权相关资源,然后继续操作。

    To attach the instances, the total capacity will be greater than the max size. 原因:伸缩组内的实例数不能大于伸缩组设置的最大值,如果添加实例到伸缩组,会导致伸缩组内实例数大于伸缩组最大值,因此被拒绝执行。 建议:请检查目前实例数量或伸缩规则配置,确保执行伸缩规则后不会超出实例数量限制。

    The current status of virtual switch does not support this operation. 原因:虚拟交换机(Vswitch)的状态为pending或modifying,伸缩组暂时无法执行伸缩活动。 建议:请检查伸缩组关联的虚拟交换机的状态,确保处于可用状态,然后重试。

    The specified virtual switch does not exist. 原因:虚拟交换机不存在。 建议:请确保伸缩组关联的虚拟交换机未被删除。

    The specified launch template set is not found. 原因:实例启动模板不存在。 建议:请登录ECS控制台,确保伸缩组关联的实例启动模板已存在,然后重新设置伸缩组关联的实例启动模板。

    Instance "xxxxx" and the specified scaling group are not in the same VPC. 原因:当前ECS实例所属的专有网络(VPC)与伸缩组对应的专有网络不一致。 建议:请确保专有网络伸缩组内的ECS实例与伸缩组属于同一个专有网络,或者ECS实例网络类型为经典网络。

    The specified virtual switch and the instance in Load Balancer "xxxxx" are not in the same VPC. 原因:负载均衡实例与虚拟交换机(Vswitch)所属的专有网络(VPC)不一致。 建议:请确保Vswitch和负载均衡实例处于同一个专有网络下,负载均衡实例的添加限制请参考在弹性伸缩中使用负载均衡服务。

    Instance "xxxx" is already attached to another scaling group. 原因:ECS实例只能添加到一个伸缩组,不能同时属于多个伸缩组。 建议:请确保待添加的ECS实例没有加入到其它伸缩组。

    The specified image does not exist. 原因:镜像不存在。 建议:请检查伸缩配置,确保镜像可用。

    DataDiskSnapshotId "xxxx" does not exist. 原因:数据盘快照不存在。 建议:请检查伸缩配置,确保数据盘的快照可用。

    伸缩活动执行失败 如果伸缩活动执行失败,您可以从详细信息了解原因,并采取对应的解决方案,如下表所示:

    伸缩活动详细信息 原因及建议 Fail to scale instances for scaling group("Ignore to remove N instances("instances in standby/protected status")"). 原因:指定实例处于备用/实例保护状态。 建议:请手动移除或释放实例。 说明 具体说明请参考实例保护和实例备用。 Fail to remove Instances "i-xxx1, i-xxx2"("The current status of the specified scaling group does not support this action."). 原因:当前伸缩组状态不支持移除实例操作。 建议:请确保伸缩组状态为生效。移除实例相关限制请参考官方文档RemoveInstances。

    Fail to create Instances into scaling group("The specified InstanceType has been offline."). 原因:指定实例规格已下线。 建议:请在伸缩配置中选择在售的实例规格,更多说明请参考实例规格族汇总。

    Fail to create Instances into scaling group("The specified ImageId does not exist."). 原因:伸缩配置指定镜像ID不存在。 建议:请检查伸缩配置,确认指定镜像可用,或者重新选择可用的镜像。

    Fail to create Instances into scaling group("Your account has been in arrears."). 原因:您的账户已欠费。 建议:请保证账户额度充足,您可以在费用中心查看账户费用信息。

    Fail to create Instances into scaling group("Your account does not have enough balance."). 原因:您的账户可用额度不足。 建议:请保证账户额度充足,您可以在费用中心查看账户费用信息。

    Fail to create Instances into scaling group("Your account has not passed the real-name authentication yet."). 原因:您的账户尚未通过实名认证。 建议:请开启实名认证。

    Fail to create Instances into scaling group("The specified parameter "spotPriceLimit" can't be lower than current public price."). 原因:指定抢占式实例的每小时最高价格低于当前市场价格。 建议:请检查伸缩配置,重新设置抢占式实例出价或者出价策略,确保满足创建抢占式实例的条件。更多信息请参考抢占式实例。

    Fail to create Instances into scaling group("Living afterpay instances quota exceeded."). 原因:您持有的按量付费实例已超过限额。 建议:请联系客服或提交工单申请提高按量付费实例限额。

    Fail to create Instances into scaling group("The specified parameter "KeyPairName" does not exist in our records."). 原因:伸缩配置中指定密钥对不存在。 建议:请检查伸缩配置,确保当前密钥对可用,或者重新设置密钥对。

    Fail to create Instances into scaling group("The specified parameter 'SystemDisk.Category' is not support IoOptimized Instance. Valid Values: cloud_efficiency;cloud_ssd. "). 原因:当前系统盘类型不支持IO优化实例。 建议:请检查伸缩配置,修改系统盘类型,建议值: 高效云盘(cloud_efficiency) SSD云盘(cloud_ssd) Fail to create Instances into scaling group("The resource is out of stock in the specified zone. Please try other types, or choose other regions and zones."). 原因:指定资源库存不足。 建议:请检查伸缩配置和伸缩组信息,视情况选择其他实例规格或者可用区。

    Fail to create Instances into scaling group("The RAM user does not have the privilege to pass a RAM role."). 原因:伸缩配置中指定RAM角色不存在。 建议:请检查伸缩配置,重新指定合法RAM角色。

    Fail to create Instances into scaling group("No payment method has been registered on the account."). 原因:当前账户未设置默认支付方式。 建议:请前往账号中心设置默认支付方式。

    Fail to create Instances into scaling group("Exceeding the allowed amount of instances of a security group."). 原因:指定安全组下的实例数量超过上限。 建议:请检查当前伸缩组,尝试将单个伸缩组扩展成多个伸缩组,并分别关联不同的安全组,以满足横向扩容的需要。

    Fail to create Instance into scaling group("The current status of instance "pending" does not support this action."). 原因:当前实例状态不支持指定操作。 建议:请检查确实例状态,确保为Running后重试。

    Fail to create Instances into scaling group("Abandon lifecycleActionResult parameter caused the instance to rollback."). 原因:伸缩组配置了扩容(ScaleOut)类型的生命周期挂钩(LifecycleHook),当伸缩组扩容时,生命周期挂钩被触发,并且生命周期挂钩最终的执行结果为拒绝,导致扩容伸缩活动回滚,扩容出来的 ECS 实例被释放。 建议:请检查生命周期挂钩的执行策略。 说明 更多生命周期挂钩的信息,请参考创建生命周期挂钩。

    Fail to create instance into scaling group("The specified SecurityGroupId is invalid or does not exist.") 原因:安全组不存在。 建议:请检查伸缩配置,重新指定已存在的安全组。

    Fail to create instance into scaling group("The specified ImageId does not exist.") 原因:镜像不存在。 建议:请检查伸缩配置,重新指定已存在的镜像。

    Fail to create instance into scaling group("Your account has been in arrears.") 原因:您的账户可用额度不足。 建议:请保证账户额度充足。

    Fail to scale instances for scaling group("Backend server quota exceeded in load balancer "lb-xxxxxxx"."). 原因:负载均衡实例的后端服务器组下可挂载ECS实例配额超出限制。 建议:请调整后端服务器的配额。更多说明请参考使用限制和管理配额。

    Fail to create Instances into scaling group("The specified imageName does not exist."). 原因:镜像名称不存在。 建议:请检查伸缩配置,重新指定已存在的镜像。

    Fail to create Instances into scaling group("This resource type is not supported. Please try other resource types."). 原因:可用区下无指定的资源类型。 建议:建议在伸缩组中设置多可用区,并在伸缩配置中设置多实例规格,提高扩容成功率。更多说明请参考使用自定义伸缩配置创建伸缩组和创建伸缩配置。

    Fail to create Instances into scaling group("The specified parameter SnapshotId is not exist."). 原因:磁盘快照不存在。 建议:请检查伸缩配置,重新指定已存在的磁盘快照。

    Fail to create Instances into scaling group("Don't have enough private IPs in this switch"). 原因:虚拟交换机没有足够的私网IP。 建议:请检查伸缩配置关联的虚拟交换机,调大虚拟交换机可用私网IP数量,或者在伸缩组配置中设置多可用区。更多说明请参考使用自定义伸缩配置创建伸缩组。

    Fail to create Instances into scaling group("The specified parameter SystemDisk.Size is less than the image size."). 原因:系统盘容量小于镜像文件大小。 建议:请检查伸缩配置,增大系统盘容量或者使用占用空间更小的镜像。

    Fail to create Instances into scaling group("Living postPaid disks quota exceeded."). 原因:当前账号下现存的按量付费磁盘限额超过限制。 建议:请联系客服或提交工单申请调整配额。

    Fail to create Instances into scaling group("The specified ram role is not authorized for ecs, please check your role policy."). 原因:弹性伸缩服务对应的RAM角色AliyunEssDefaultRole没有包括ECS接口权限。 建议:请重新授权。 说明 具体操作请参考AutoScaling授权指南。 Fail to create instance into scaling group("The resource in the specified zone is no longer available for sale. Please try other regions and zones.") 原因:实例规格在指定可用区下已停止售卖。 建议:请检查伸缩组设置,建议设置多可用区。更多说明请参考使用自定义伸缩配置创建伸缩组。

    Fail to create instance into scaling group("The resource is out of stock in the specified zone. Please try other types, or choose other regions and zones.") 原因:实例规格在指定可用区下已停止售卖。 建议:建议在伸缩组中设置多可用区,并在伸缩配置中设置多实例规格,提高扩容成功率。更多说明请参考使用自定义伸缩配置创建伸缩组和创建伸缩配置。

    Fail to create instance into scaling group("The specified parameter "KeyPairName" only support IoOptimized Instance.") 原因:实例规格为非I/O的优化实例规格,非I/O优化实例不支持密钥对。 建议:请检查伸缩配置,调整伸缩配置实例规格为I/O优化实例规格,或者删除KeyPair参数。

    Fail to create instance into scaling group("A RAM role can't be used for classic instance.") 原因:经典网络类型实例不支持RAM角色。 建议:请检查伸缩组的网络类型,建议您修改伸缩组网络类型为专有网络,或者移除伸缩配置中的RamRoleName参数。

    Fail to create instance into scaling group("The specified parameter "RAMRoleName" does not exist.") 原因:RAMRoleName不存在。 建议:请登录访问控制控制台检查当前RAM角色是否存在,或者指定其它RAM角色。

    Fail to create instance into scaling group("The specified image does not support the specified InstanceType.") 原因:镜像与实例规格不匹配。 建议:请登录ECS售卖页查看实例规格支持的镜像,然后重新调整伸缩配置。

    Fail to create instance into scaling group("The requested resource is sold out in the specified zone; try other types of resources or other regions and zones.") 原因:实例规格在伸缩组对应的可用区下库存不足。 建议:建议在伸缩组中设置多可用区,并在伸缩配置中设置多实例规格,提高扩容成功率。更多说明请参考使用自定义伸缩配置创建伸缩组和创建伸缩配置。

    2020-03-23 09:43:36
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
基于流量的灰度发布和自动弹性实践 立即下载
网络流量异常行为分析系统 立即下载
k8s自动伸缩那些事资料下载 立即下载