2.2动态 TCO模型
阿里巴巴曾经以单笔交易 /支付成本来衡量基础设施的整体架构水平,其优点是从财务上能够直接从资本投入和销售额的角度给出端到端的投资收益比,然而交易额的产生不仅依赖于基础设施(IaaS层)的架构水平,与中间件(PaaS层)及业务平台(SaaS层)的业务逻辑设计及软件架构水平也紧密相关。
在此,我们试图定义一个涵盖数据中心整体、跟实际业务使用情况、反映基础设施架构水平的TCO模型。我们期望该模型能够给业务方提供直观的单位业务量所需成本,驱动基础设施架构的代际演进并真实观测到每代数据中心TCO的不断下降。
数据中心的整体成本需要综合考量 IDC、网络及服务器的初期一次性固定投资
(CapEx)及后续运营成本(OpEx)。以任何单一专业成本的角度来衡量TCO都将是有偏的估计,例如从服务器的角度出发,将网络端口成本、电力成本、运维人员成本折合到总成本中,由于涉及网络收敛比、服务器在线数量变化等复杂因素影响,人们倾向于将网络端口成本和运维成本按照固定比例进行折算,使得TCO沦为一个一成不变的固定值。然而我们期望TCO是能够动态反映单位业务量所产生的总体成本,它应当是一个根据不同采样时段动态变化的值,而非静态值。因此,我们建议在衡量数据中心总体成本时,能够脱离单一领域的限制,从财务的角度分别计算各领域的CapEx,按照既定的折旧模型再加上 OpEx之后,计算出每年数据中心的整体拥有成本。当然,这只是我们期望模型的一个方面。
我们期望 TCO模型能够贴近实际业务模型,展现出提供单位业务量所需的总体成本。这给我们提出了严峻的挑战,实际的互联网业务形态丰富多样,并且仍在快速增长当中,针对每个业务形态定制一个TCO模型,显然是徒劳的。因此,我们期望抽象出极少量的业务形态来衡量TCO,并以此指导业务方根据各自的业务逻辑进行转化和映射,评估出适合具体业务方的能力指标。例如,针对计算集中型业务,我们可以提出一个 TCO模型,其成本方面的考量可按照上述方法统计,而产能方面则可通过一个抽象的工具进行测量,例如阿里巴巴有一套面向计算集群的测试套件,其功能是通过多个单项压力测试的方法,加权评估集群的总体计算能力。
最终,我们获取数据中心某一时段的资本成本,并且测量到该时段基于典型场景的业务量,便可以计算出产生单位计算量所需的总体成本。这个比值则是我们需要的TCO,使得 TCO可以摆脱具体业务形态的依赖,而抽象出一套适合基础设施层面的架构水平衡量准则。