对于阿里的技术同学来说,每年的双十一都是一场“盛宴”。为了让顾客有顺滑的购物体验,给商户提供更多样化的让利活动,阿里电商平台对于效率、可靠性、规模性的要求在双十一的驱动下成倍提高,激发着技术人的潜力。作为基础技术核心之一,阿里中间件也会在每年双十一迎来一次技术的全面演进和升级。
阿里在 2019 年完成了全站的核心系统上云,对于阿里中间件来讲,这是一个意义非凡的机遇和挑战。实际上,从 2011 年 Dubbo 开源开始,阿里中间件就开始尝试在云产品和开源方面努力探索,希望让支持阿里核心业务的中间件系统从封闭走向开放,服务更广泛的用户。过去几年,阿里云推出了 EDAS 产品线,希望能够把阿里在微服务和应用托管体系的实践经验分享给用户;与此同时,在开源社区中推出了 Dubbo、RocketMQ、Nacos、Seata 等多个为人熟知的开源项目,鼓励广大开发者共建中间件生态体系。
阿里云在探索中一直存在的苦恼,是内部的自研体系、商业化的产品技术与开源的项目,三方的技术路线一直没有机会融为一体。然而,就在今年阿里云提出了“三位一体”理念,即将“自研技术”、“开源项目”、“商业产品”形成统一的技术体系,最大化技术的价值。随着阿里自研体系的上云,这个机遇终于到来了。今年,让阿里云中间件技术人最兴奋的,除了支持双十一大促的再一次成功,更是能用这些技术持续赋能阿里云上数以万计的企业、机构、开发者以及他们的用户,把双十一的技术红利发挥到极致。
1、基于集团场景,沉淀Spring Cloud Alibaba全家桶,形成微服务领域最佳实践
1)在考拉入淘过程中,集团基于开源核心预研的下一代服务框架 Dubbo 3.0,完美融合了内部 HSF 的特性。考拉基于 Dubbo 以及 MSE 提供的服务发现和流量治理能力,轻松实现了与集团核心电商业务的接入。在今年双十一大促中,考拉核心链路上的数百个应用运行在 Dubbo 3.0 这个版本上。
2)Nacos 与 Dubbo/Spring Cloud Alibaba 生态完成无缝整合
2018 年,随着阿里开源战略的推进,阿里云以10 年双十一沉淀的注册中心和配置中心为基础开源了 Nacos,以简单易用、性能卓越、高可用、特性丰富等核心竞争力快速成为领域首选。并且跟阿里 Dubbo/Spring Cloud Alibaba 生态完成无缝整合,形成微服务领域最佳实践。2020 年,随着阿里全站上云的全面推进,阿里云将阿里经济体内部注册中心和配置中心用 Nacos 重构完成,并以云产品 MSE支撑了淘宝、饿了么、考拉等核心 BU 平稳度过双十一。
阿里微服务体系通过阿里内部场景锻炼出高性能和高可用的核心竞争力,通过开源构建了生态和标准,凭借MSE、EDAS 等云产品完成产品化和能力输出。基于此,阿里云中间件完成了三位一体的正向循环,通过标准持续输出阿里巴巴的核心竞争力,让外部企业快速享有阿里微服务能力,加速企业数字化转型!
2、阿里云 Prometheus 监控服务,提供了水平扩展能力,平均查询性能比开源提升 30%以上
基础设施的自动化是云原生红利能够被充分释放的前提,而可观测性是一切自动化决策的基石。Prometheus 是 CNCF 下第二个毕业的项目,已成为云原生可观测领域的事实标准之一。如何将开源 Prometheus 的优秀生态与技术架构与阿里云原生基础设施进行整合,提供一个监、管、控一体化的自动化运维平台,提升业务系统的交付效率与在线稳定性,是阿里云这一年多来不断探索的目标。在今年的双十一期间我们见证了这一目标的实现,阿里云 Prometheus 服务成功地为众多大规模在线业务保驾护航,帮助业务系统顺利度过洪峰。
相比于自研的监控体系,阿里云 Prometheus 服务与云生态有更紧密的集成,实现了与托管类产品底层 API 的深度集成与联动。外部用户也无需顾虑运维 Prometheus 服务,只需一键开启一组资源开销极小的无状态采集组件,即可实现自动服务发现、高可靠的数据采集与上报,以极低的迁移成本将自建 Prometheus 迁移到阿里云的 Prometheus 服务上。相比于开源版本的 Prometheus,阿里云的 Prometheus 为了应对阿里的大规模体量,提供了水平扩展能力,能够应对超大规模的指标写入,其优化后的查询引擎,针对高维查询、正则查询、长时间线查询等场景做了特定优化,平均查询性能比开源版本提升 30%以上。
钉钉视频会议在今年基于 ASK 实现了全球系统的全量容器化,采用云原生 Serverless 技术,使得整体业务架构变得更加轻量、易运维,能够更好地应对音视频领域流量特征所带来的特殊资源弹性诉求。阿里云 Prometheus 服务针对 ASK 集群特性做了一系列定制,实现了无损的 Serverless 指标采集能力,以及钉钉视频会议整个 Serverless 架构的全局可观测能力。与此同时,我们开始在无状态工作负载下探索,基于 Prometheus 指标数据的自动弹性能力。
3、基于 RocketMQ 的消息产品家族无缝快速上云,拥抱标准,引领标准
RocketMQ 是阿里巴巴在 2012 年开源的第三代分布式消息中间件,并在 2017 年正式成为 Apache 顶级开源项目。在阿里经济体内部,RocketMQ 一直承载着阿里巴巴所有核心链路的消息流转,历经多年双十一万亿级消息洪峰的严苛考验。随着阿里全站上云战略的推进,阿里云消息团队打造了三位一体的技术融合架构,克服了微内核抽象统一、商业化差异性打造等难关,实现了自研、开源、商用三方技术的平滑兼容,以同一消息体系支撑阿里经济体、阿里云产品以及开源社区需求。通过三种截然不同场景的打磨,RocketMQ 可以帮助用户无缝快速上云。
今年双十一,菜鸟、饿了么、考拉等阿里经济体核心部门将其消息系统迁移到云上消息产品,相比于原有需要提前预算规划的使用方式,云消息产品为其提供了快速按需扩缩容的弹性能力,不仅节省了成本,也消除了其对容量预估失准的担忧。除此之外,三位一体技术融合也为内部用户带来了诸多便利。RocketMQ 开源社区中的一大批生态项目可以快速在经济体内部以及云上得以复用,不仅节省了开发成本,也使得开发模式从依赖经济体内部组件的封闭方式,走向与社区开源生态协同的开放方式,在拥抱标准的同时引领标准。而这些生态项目通过阿里经济体内部严苛场景的打磨,也正在变的愈发成熟,吸引着越来越多的开发者。
目前,阿里云消息产品已服务于数千家付费企业用户,为其提供开箱即用,稳定可靠的消息服务。三位一体技术融合使得 RocketMQ 不仅让阿里成熟稳定的技术能够服务外部客户,造福无数企业和开发者,也通过开源与开放的共赢方式,消除了用户被厂商锁定的担忧。
继9月云栖大会上阿里巴巴宣布成立云原生技术委员会,云原生升级为阿里技术新战略。2020双11核心系统全面云原生化,成为云原生技术委员会推动阿里经济体全面云原生化的重要里程碑。阿里巴巴集团首席技术官程立表示,“云原生带来最大的不同是让阿里真正实现了自研、商用、开源的“三位一体”,双11的核心技术可以直接给到客户使用,省略了经过云上沉淀再输出的过程,降低了客户获取“双11同款技术引擎”的门槛和成本,可帮助客户快速迈入数字原生时代。”我们坚信驱动技术演进的背后一定是复杂的业务场景、严格的稳定性和挑战以及来自于用户的的信任和支持。
更多精彩戳我前往2020阿里巴巴双11技术专题