3. 如何衡量弹性能力成熟度?
1) 如何衡量弹性能力
在衡量弹性能力之前,可以先看看几个典型的弹性业务场景,包括:
• 电商平台:年度大促或周期性促销需要大量的临时资源来保障促销活动的流量洪峰,比如国内的双11大促销、黑五活动,每日秒杀等。
• 社交媒体:类似微博等媒体平台,当出现艺人八卦引发社交用户热议等类似场景时,需要紧急快速扩容,避免服务不可用。
• 在线旅游平台:在长假前一段时间会出现机票酒店查询与订购的请求高峰,比如国庆假长假,春节假期等。
• 在线视频/游戏平台:每天晚上放学或下班后到半夜期间是休闲娱乐的高峰期,平台的访问流量是白天的几倍或几十倍。
• 临时的开发测试:需要快速完成测试资源的交付,并在开发测试结束后释放对应资源。
在评估弹性能力之前,首先需要明确不同业务场景在做弹性化改造过程中面临的一些挑战,具体如下:
• 弹性速度:尽管云上计算资源是按需取用,但资源的交付速度(从资源购买到资源可用的延迟)至关重要。当某个流量洪峰突然出现时,留给资源响应的时间通常不会太长,如果资源无法快速交付,则会直接影响业务的正常访问。
• 弹性成功率:公有云上资源规模庞大,对单个用户而言可以认为是提供无限算力,但不同云厂商在不同地域的资源池规模大小不一。当某个可用区的资源规模有限时,用户可能会遇到因资源不足导致弹性算力无法满足的情况,弹性成功率将直接影响业务的连续性和可用性。
• 弹性效率:对于类似渲染或科学计算等需要大规模算力的场景而言,如果用户分批申请所需算力,只有当全部算力都准备完毕才能开始执行任务,必然会导致部分已申请但未使用的资源浪费,因此,一次性交付大规模算力的效率将大大提升业务的效率。
• 弹性准确性:对于自动响应业务负载波动的弹性场景而言,如果申请的资源需求大于当前业务负载需求,则会出现过度供给带来资源和成本浪费,而如果拥有的资源需求小于当前业务负载需求,则会出现业务服务降级甚至不可用的场景。因此,提供与业务负载匹配的准确资源量,能更好的实现业务与成本的平衡。
• 弹性资源预定:对于非常规的弹性需求,比如类似双十一的年度大促活动或者新游戏开服时,客户在无法确保弹性成功率的情况下,需要额外的弹性资源保障机制以应对预期外的业务流量。
2) 弹性能力分级
云上的弹性能力与资源的使用和成本密不可分,要全面衡量业务的弹性成熟度需要同时从业务的弹性管理能力和资源成本管理两个维度进行。
因此,我们将弹性成熟度分为以下五个等级,对应的能力要求如下:
如果您希望对所在企业弹性能力成熟度进行评估,建议至第十章“CloudOps成熟度自评”。