演练事件处理程序有点难
ECS实例系统事件是影响实例运行状态的有计划或非预期事件。为了ECS实例上的业务平稳运行,最佳的做法是通过程序自动化地处理事件。您可以参考这篇文章:使用OpenAPI自动化处理ECS系统事件
但这里有一个问题,程序写完了不好测试。系统事件是系统在特定场景下生成的,不一定能人工触发;ECS实例跑的很稳定,总是不出问题,几个月也没等到一个事件。我们需要一种方式来方便地演练事件处理程序。
ECS演练OpenAPI
ECS提供了一对用来演练事件处理程序的OpenAPI:CreateSimulatedSystemEvents和CancelSimulatedSystemEvents,分别用来创建和取消模拟系统事件。
什么是模拟系统事件?模拟系统事件是专门用来演练系统事件处理程序的。通过设置一个模拟系统事件,您可以从OpenAPI、控制台、云监控等等事件消费渠道中看到和真实事件一样的数据。
除了产生事件数据,模拟事件还会模拟事件的生命周期变化。
- 在用户设置了模拟系统事件后,该事件处于待执行(Scheduled)状态
- 在到达计划执行时间(NotBefore)后,事件将转变为执行中(Executing)状态,然后很快变成已执行(Executed)状态
- 模拟事件也会响应用户操作,比如对于SystemMaintenance.Reboot事件,用户在计划执行时间(NotBefore)之前重启实例,事件将变为已避免(Avoided)状态
- 用户可以在事件未完结前,调用CancelSimulatedSystemEvents取消事件,事件将变为已取消(Canceled)状态
模拟事件的生命周期如下:
代码示例
以下以SystemMaintenance.Reboot为例,创建了两个模拟系统事件,随即又取消了其中的一个事件:
# coding=utf-8
# make sure the sdk version is 4.10.0 or upper, you can use command 'pip show aliyun-python-sdk-ecs' to check
# if the python sdk is not installed, use 'sudo pip install aliyun-python-sdk-ecs'
# if the python sdk is installed, use 'sudo pip install --upgrade aliyun-python-sdk-ecs'
import json
import logging
from aliyunsdkcore import client
from aliyunsdkecs.request.v20140526.CancelSimulatedSystemEventsRequest import CancelSimulatedSystemEventsRequest
from aliyunsdkecs.request.v20140526.CreateSimulatedSystemEventsRequest import CreateSimulatedSystemEventsRequest
logging.basicConfig(level=logging.INFO,
format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
datefmt='%a, %d %b %Y %H:%M:%S')
# your access key Id
ak_id = "YOU_ACCESS_KEY_ID"
# your access key secret
ak_secret = "YOU_ACCESS_SECRET"
region_id = "cn-beijing"
client = client.AcsClient(ak_id, ak_secret, region_id)
# send open api request
def _send_request(request):
request.set_accept_format('json')
try:
response_str = client.do_action_with_exception(request)
logging.info(response_str)
response_detail = json.loads(response_str)
return response_detail
except Exception as e:
logging.error(e)
def build_create_request(event_type, not_before, instance_ids):
request = CreateSimulatedSystemEventsRequest()
request.set_EventType(event_type)
request.set_NotBefore(not_before)
request.set_InstanceIds(instance_ids)
return request
def print_created_event_id(response):
error_code = response.get('Code')
if error_code is None:
event_id_list = response.get('EventIdSet').get('EventId')
print("Created %s simulated events: %s", len(event_id_list), event_id_list)
else:
print("Creating failed, error code: %s", error_code)
def get_created_event_id(response):
error_code = response.get('Code')
if error_code is None:
event_id_list = response.get('EventIdSet').get('EventId')
return event_id_list
else:
return []
def build_cancel_request(event_id):
request = CancelSimulatedSystemEventsRequest()
request.set_EventIds([event_id])
return request
if __name__ == '__main__':
request = build_create_request("SystemMaintenance.Reboot", "2018-09-01T00:00:00Z", ["i-2zegswzznxbp168sc5c9", "i-2zeimxypwhnj04sbgf5t"])
response = _send_request(request)
event_ids = get_created_event_id(response)
if event_ids:
print("Created %s simulated events: %s"%(len(event_ids), event_ids))
cancel_event_id = event_ids[0]
print("Now we cancel one event %s" % (cancel_event_id))
cancel_request = build_cancel_request(cancel_event_id)
cancel_response = _send_request(cancel_request)
if not cancel_response.get('Code'):
print("Cancel succeeded")
代码执行后的输出:
Created 2 simulated events: [u'e-2zec65b85gi9zwcv1kpz', u'e-2zec65b85gi9zwcv1kq0']
Wed, 22 Aug 2018 18:39:49 simulate_system_event.py[line:35] INFO {"EventIdSet":{"EventId":["e-2zec65b85gi9zwcv1kpz","e-2zec65b85gi9zwcv1kq0"]},"RequestId":"C1762464-CCC2-46EC-B233-92A4D9C1782C"}
Now we cancel one event e-2zec65b85gi9zwcv1kpz
Cancel succeeded
Wed, 22 Aug 2018 18:39:49 simulate_system_event.py[line:35] INFO {"RequestId":"44286901-1BC3-4BA0-AAAF-C3CF20578E0F"}
限制和注意事项
- 用户只能在自己拥有的实例上设置和取消系统事件
- 单用户设置的处于Scheduled状态的模拟系统事件不能超过1000个