中间件总体介绍
阿里巴巴中间件与稳定性平台团队,是一个给业务应用团队以提供低成本,高可用,可扩展的弹性互联网系统解决方案为己任的技术团队,前身是成立于7年之前的淘宝平台架构部,而后随着业务领域,尤其是针对性能和稳定性技术领域的成功探索与突破,目前已经发展为一个涵盖消息通信,数据处理,性能优化和稳定性等各类技术的互联网架构服务平台。他成功地支持了包括淘宝,天猫,阿里云,小微金融等众多兄弟bu的业务与技术需求。在2013年的双11狂欢节中,中间件与稳定性平台团队也再一次站在了前排,与其他团队一起,为了“让天下没有难做的生意”贡献了自己的一份力量。
中间件与稳定性平台团队,是国内为数不多的极具技术挑战性的团队之一,依托于全球规模最大的阿里巴巴电子商务平台所带来的巨大流量和海量数据,以及对于电子商务平台固有的稳定性要求,使得团队有机会去面对一个又一个技术难题,创造一个又一个技术奇迹。从整体来看,中间件与稳定性平台的技术体系可以分为软负载配置、分布式服务框架、消息中间件、数据访问层、应用服务器和稳定性平台等。
中间件整体技术体系
如果我们将整个网站看成是一个大工厂,每个业务逻辑单元(Business Unit)看成是工厂内完成单个工序的车间,那么中间件就是能够让所有车间发挥出最大生产效率的各类支持性部门。
软负载系统(Software Load Balancing),通过软件系统解决请求的均衡负载。相对于F5或者LVS这些负载设备,软负载系统有以下特点:无中心化,成本更低,效率更高,功能更强。在解决长连接的负载均衡场景上,软负载系统可以做到长连接中的每个请求包级别的负载均衡,最大程度的优化资源的使用。
Java的运行时容器(Java Container和Web Server),主要为用户提供了软件库版本隔离和依赖升级推送的功能,就像是这家工厂的厂房,每个车间都要配备自己最趁手的工具,不同车间的工具如果相互共享使用,很容易出现螺丝找不到螺母的时候,从而造成生产停滞,因此,每个车间都应该有他们自己所需要的专用工具,并且要保证工具永远维持在最趁手的状态,才能让我们的工厂发挥出最理想的效能。
远程方法调用(RPC),传统意义上也被称为SOA,主要为用户提供了远程调用和服务治理的功能,他们能够让应用方将原来的整套业务逻辑拆分到不同的机器中运行。就像是车间之间的传送带,能够将各个车间的生产结合到一起,促进了分工合作,从而提升了生产效率。
消息系统(MQ),主要为用户提供了发送通知的功能,让一些非核心流程可以并行执行。 他们就像一家工厂的电子工单,最终产品一般是由多条生产线一起协作生产出来的:产品的各个部件的生产是完全可以并行的。但最终用户则需要的是包装好的全部产品。这时候就需要工单系统,让整个企业内可以并行生产的部分能够协调一致的进行产品的生产,并最终能够以合适的数量进行成品组装。
分布式存储(Distributed Storage),则主要为用户提供了可无限扩展的数据存储服务。这就像这家工厂的仓库,能否按照实际的需要,做到仓库的自动化运维和管理,按需扩展和收缩,是仓库运维管理中最为重要的挑战。
分布式调用跟踪系统(Distributed Tracing)通过收集和分析在不同中间件上网络调用的日志埋点,可以得到同一次请求上的各个系统的调用链关系,有助于梳理应用的请求入口与服务的调用来源、依赖关系,同时,也对分析系统调用瓶颈、估算链路容量、快速定位异常有很大帮助。
持续稳定性平台(Continue Stable Platform)是一个平台化的产品,涉及依赖治理、容量规划、实时监控和降级管理等多个领域 ,致力为阿里巴巴的各个系统提供稳定的数据和工具支持。
在本文后面的章节中,我们将依次概要介绍这些中间件和稳定产品,并以双11大促作为契机,为大家介绍那些我们在双11中使用的技术手段以及优化案例,与大家一起重新经历那些激动又紧张的日日夜夜。