重磅发布 | 《不一样的 双11 技术,阿里巴巴经济体云原生实践》电子书开放下载

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 2019 双11,订单创新峰值达到 54.4 万笔/秒,单日数据处理量达到 970PB,面对世界级流量洪峰,今年的阿里巴巴交出了一份亮眼的云原生技术成绩单,并实现了100% 核心应用以云原生的方式上云: 双11 基础设施 100% 上云 支撑 双11 在线业务容器规模达到 200 万 采用神龙弹性裸金属服务器计算性价比提升 20%  这些数据背后是对一个个技术问题的反复尝试与实践。

点击下载
《不一样的 双11 技术,阿里巴巴经济体云原生实践》

2019 双11,订单创新峰值达到 54.4 万笔/秒,单日数据处理量达到 970PB,面对世界级流量洪峰,今年的阿里巴巴交出了一份亮眼的云原生技术成绩单,并实现了100% 核心应用以云原生的方式上云:

  • 双11 基础设施 100% 上云
  • 支撑 双11 在线业务容器规模达到 200 万
  • 采用神龙弹性裸金属服务器计算性价比提升 20% 


这些数据背后是对一个个技术问题的反复尝试与实践。这一次,我们对云原生技术在 双11 的实践细节进行深挖,筛选了其中 22 篇有代表性的文章进行重新编排,整理成书《不一样的 双11 技术:阿里巴巴经济体云原生实践》旨在为行走在云原生之路上的开发者打开新思路、提供一些有益参考。

大咖寄语

2.png
3.png


我们采访了上云总架构师毕玄,以下是他对于 双11 核心系统 100% 上云背后云原生的技术思考。


与客户在同一架“飞机”上


王坚院士曾在很多场合都和阿里的技术人员讲到:阿里云作为一家输出技术的公司,我们需要做到和我们的客户在同一架“飞机”上,而不仅仅是“造飞机”或看着“飞机”在空中飞,阿里经济体云化最重要的就是要做到让我们和客户在同一架“飞机”上。


早在几年前,阿里巴巴经济体就开始借助阿里云的机器资源来支撑 双11 零点的高峰,云的弹性资源优势使得 双11 的机器资源投入成本下降超过 50% 以上,但在这些机器资源上部署的却是我们自己的技术体系,例如容器、中间件、数据库、缓存等,也就意味着我们和客户其实是在不同类型的“飞机”上,而且阿里巴巴经济体在的“飞机”是专为阿里巴巴定制打造的,外部客户是买不到的,这是一个典型的从 Hosting 演进到 Cloud Hosting 的阶段。为了切实做到和客户在同一架“飞机”上,在今年 3 月份,阿里云智能事业群 CTO 张建锋(花名:行癫)正式对外宣布未来一到两年,阿里巴巴百分之百的业务要跑在公共云上,成为“云上的阿里巴巴”。


从 Cloud Hosting 到 Cloud Native


阿里巴巴经济体云化是阿里技术发展史上继之前的分布式架构、异地多活后的又一轮巨大的架构升级,这次架构升级需要把我们从 Cloud Hosting 演进到 Cloud Native,Cloud Native 作为技术圈最火热的名词,不同的人的眼中有不同的定义,我们认为 CloudNative 带来的是一次系统构建方式的巨大变革,Cloud Native 是指业务系统的构建从基于自有、封闭的技术体系,走向基于开放、公共的 Cloud 的技术体系。


在 Cloud Native 时代之前,多数公司随着业务的发展,或多或少都会打造出自有、封闭的技术体系,这一方面造成了巨大的投入,使得公司的技术人才力量没有完全专注的投入在业务上,另一方面也造成了这个行业人才流动的困难,因为知识体系的不同,每到一家新的公司几乎都是全新的一套,这个一定程度上影响了业务创新的速度,尽管很多的开源产品在一定程度上有助于解决这个问题,但还不足以体系化,而在 Cloud Native 时代,我们认为会有两个典型的特征:

  1. 对于业务系统端而言,在做系统设计的技术选型上,Cloud 提供了远比自有技术体系更为丰富了多的选择,这使得架构师可以更好的根据业务的状况、阶段等来进行更合理、合适的技术选型,最后表现出来的特征会是业务系统基于 Cloud 的技术体系来搭建,而越来越少的自建或自研,就像 Cloud Hosting 带来的越来越少的公司自己 Hosting 机器的变化一样;
  2. 对于云厂商而言,会提供越来越多开放、主流的技术栈的技术产品,从而让客户有更为丰富和自主的选择权,同时云厂商会去做到让这些技术产品的互通性更好,这样客户才能真正做到对于不同类型的业务选择不同的技术产品和体系。


按照这样的思路,阿里巴巴经济体云化在走向 Cloud Native 的道路上,我们的原则是:

  1. 业务系统不再采用自有、封闭的技术产品,而是阿里云上对外提供哪些技术产品,我们就基于这些来重构、新建我们的业务系统;
  2. 阿里云上提供相应技术领域的主流技术产品,同时根据阿里业务的需求去新增、完善、改造相应的技术产品,并增强不同技术产品的互通性、开放性。


按照这样的原则,随着阿里经济体云化项目的进展,阿里的业务系统就必将完成从基于自有、封闭的自有体系构建,进化到和阿里云的客户一样,基于阿里云上公共的技术产品的体系来构建,从而实现和客户在同一架“飞机”上。


不一样的双11,云原生技术亮点

在这个双11,我们在以下几个方面有了一些不错的进展:

超大规模 Kubernetes 实践 

2017 年下半年,阿里集团开始尝试使用 Kubernetes API 来改造内部自研平台,并开始了对应用交付链路的改造,以适配 Kubernetes。2018 年下半年,阿里集团和蚂蚁金服共同投入 Kubernetes 技术生态的研发,力求通过 Kubernetes 替换内部自研平台,实现了小规模的验证,支撑了当年部分 双11 的流量。2019 年初,阿里经济体开始进行全面上云改造,阿里集团通过重新设计 Kubernetes 落地方案,适配云化环境,改造落后运维习惯,在 618 前完成了云化机房的小规模验证。2019 年 618 之后,阿里集团内部开始全面推动 Kubernetes 落地,在大促之前完成了全部核心应用运行在 Kubernetes 的目标,并完美支撑了 双11 大考。


阿里巴巴超大规模 Kubernetes 落地,经受了双11大促真实场景的考验, 单集群能支撑万级别 Node、十万级别 POD 的规模。我们推进了三个方面改造:面向终态的改造;自愈能力改造;不可变基础设施改造。相比原有传统的运维链路,扩容效率提升了 50%,集群节点在线率达到了 99.9% 以上。

阿里巴巴云原生化的最佳组合:Kubernetes+容器+神龙

今年 双11,我们通过 K8s+容器+神龙的最佳组合实现了阿里核心系统 100%以云原生的方式上云,完美支撑了 54.4w 峰值流量以及 2684 亿的成交量。基于 0 虚拟化开销的神龙裸金属,通过使用行业标准的容器与调度、编排、管理技术,推动经济体云原生技术全面升级。容器性能提升 10%、神龙节点可调度率达到 99% 以上、容器稳定性与在线率全面提升。

Service Mesh 超大规模落地

阿里巴巴在 双11 的部分电商核心应用上落地了完整的 Service Mesh 解决方案,借助 双11 的严苛业务场景完成了规模化落地前的初步技术验证;蚂蚁金服也实现了 Service Mesh 的大规模落地。Service Mesh 所带来的变化体现于:服务治理手段从过去的框架思维向平台思维转变;技术平台的建设从面向单一编程语言向面向多编程语言转变。

Service Mesh 创造了一次以开发者为中心去打造面向未来的分布式应用开发平台的机会,给其他技术产品创造了重新思考在云原生时代发展的机会,给技术基础设施如何与业务基础技术更好地协同提供了一次探索机会,并为探索面向未来的异地多活、应用永远在线的整体技术解决方案打开了一扇大门。

期待《不一样的 双11:阿里巴巴经济体云原生实践》会给你带来新的灵感。

双11 同款云产品

1.容器服务 Kubernetes 版(ACK)

2.容器镜像服务 Container Registry (ACR)

3.函数计算 2.0(事件驱动的全托管 Serverless 计算服务)

4.企业级分布式应用服务 EDAS(应用托管 + 微服务治理)

5.Serverless 应用引擎(阿里云首个面向应用的 Serverless 产品)

6.应用实时监控服务 ARMS(全栈式的性能监控)

7.链路追踪(云上华佗,成本是自建链路追踪系统的1/5或更少)

8.应用高可用服务AHAS(限流降级神器)

9.性能测试 PTS(双11同款性能压测工具)

10.消息队列 for Apache RocketMQ(服务于阿里集团 13 年,覆盖全集团所有业务)

11.消息队列 for Apache Kafka(更专业、更可靠、更安全)

12.全局事务服务 GTS(传统分布式事务10倍性能)

“阿里巴巴云原生微信公众号(ID:Alicloudnative)关注微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生流行技术趋势、云原生大规模的落地实践,做最懂云原生开发者的技术公众号。”

相关文章
|
1天前
|
Cloud Native 持续交付 云计算
构建未来:云原生架构在现代企业中的应用与实践
【5月更文挑战第25天】 随着数字化转型的浪潮席卷全球,企业正面临着前所未有的挑战与机遇。云原生技术以其独特的弹性、可扩展性和敏捷性,成为推动企业技术创新的重要力量。本文将深入探讨云原生架构的核心概念,分析其在现代企业中的应用实例,并提出实施策略和最佳实践,以助力企业在激烈的市场竞争中占据先机。
|
1天前
|
Kubernetes Cloud Native 持续交付
构建未来:云原生技术在企业数字化转型中的关键作用
【5月更文挑战第25天】 随着企业加速迈向数字化时代,传统的IT架构已无法满足市场快速演变的需求。本文探讨了云原生技术如何成为推动企业敏捷性、可扩展性和创新能力的关键因素。通过深入分析云原生的核心组件,如容器化、微服务和持续集成/持续部署(CI/CD),揭示了这些技术如何帮助企业实现灵活的资源管理、加快产品上市速度以及提高运营效率。同时,文章还将讨论企业在采纳云原生技术时面临的挑战,并提出相应的解决策略。
|
1天前
|
Kubernetes Cloud Native 持续交付
构建未来:云原生技术在企业数字化转型中的关键角色
【5月更文挑战第25天】 随着数字浪潮的不断涌动,企业面临着前所未有的转型压力与机遇。本文深入探讨了云原生技术如何成为推动企业数字化革新的核心力量,剖析其提高业务敏捷性、优化资源利用和加强系统可靠性的机制。通过具体案例分析,揭示了云原生架构和服务在支持动态环境、降低运营成本及促进持续交付方面的独特优势。文章旨在为企业决策者提供一个关于云原生技术投资和应用的全景式视角,以助力他们在数字化道路上稳步前行。
|
1天前
|
存储 Prometheus 运维
【阿里云云原生专栏】云原生下的可观测性:阿里云 ARMS 与 Prometheus 集成实践
【5月更文挑战第25天】阿里云ARMS与Prometheus集成,为云原生环境的可观测性提供强大解决方案。通过集成,二者能提供全面精准的应用监控,统一管理及高效告警,助力运维人员及时应对异常。集成示例代码展示配置方式,但需注意数据准确性、监控规划等问题。这种集成将在云原生时代发挥关键作用,不断进化以优化用户体验,推动业务稳定发展。
5 0
|
1天前
|
敏捷开发 Kubernetes Cloud Native
【阿里云云原生专栏】跨云部署与管理:阿里云云原生技术的多云策略
【5月更文挑战第25天】阿里云云原生技术提供多云策略,助力企业高效跨云部署与管理。通过容器化(如Kubernetes)、服务网格等,实现应用一致性与可移植性;统一资源管理,简化跨云操作。挑战包括数据同步、网络问题和平台差异,但阿里云的解决方案为企业在多云环境中实现资源优化、业务敏捷和系统可靠性提供了强有力支持。随着云计算发展,阿里云将持续演进其多云策略,为企业数字化转型提供保障。
8 1
|
1天前
|
运维 Cloud Native Devops
云原生技术的未来展望:构建动态且高效的应用生态系统
【5月更文挑战第25天】 在数字化转型的浪潮中,云原生技术以其独特的弹性、可扩展性和敏捷性成为推动企业IT架构现代化的关键动力。本文将深入探讨云原生的核心组件如容器化、微服务、持续集成/持续部署(CI/CD)和DevOps文化等,分析它们如何共同塑造一个高效、自动化的云计算环境。同时,文章也将对云原生技术未来可能的发展路径进行预测,并讨论如何利用这些技术来应对日益复杂的业务挑战。
|
1天前
|
Cloud Native 云计算
云原生技术:重塑现代应用开发
本文将深入探讨云原生技术如何革新传统应用开发模式,提升应用性能与开发效率。我们将通过分析云原生的核心概念、优势以及实践案例,揭示其对现代企业数字化转型的深远影响。
|
2天前
|
存储 消息中间件 弹性计算
盘点 AutoMQ 深度使用的阿里云云原生技术
AutoMQ是云原生Kafka实现,采用共享存储架构,与阿里云合作利用OSS、ESSD、ESS和抢占式实例降低成本,实现10倍于Apache Kafka的性价比,并提供自动弹性。它使用对象存储OSS实现流式数据高效读取,通过ESSD作为WAL保证性能,弹性伸缩服务ESS简化交付,抢占式实例降低成本。此外,AutoMQ利用ECS的高可用性和ESSD的高性能存储,结合NVMe协议和多重挂载技术,实现快速故障恢复和低成本运维。该系统旨在充分利用云原生能力,推动消息和流存储服务进步。
7 0
|
3天前
|
运维 监控 Cloud Native
云原生架构下的服务网格演进与实践
【5月更文挑战第23天】 随着云计算技术的不断成熟,云原生架构已成为推动企业数字化转型的关键动力。本文将深入探讨服务网格在云原生环境中的重要性,分析其在微服务管理、流量控制和安全性方面的创新应用。通过对服务网格的技术和实践案例的剖析,揭示其如何优化云原生应用的部署、运行和管理,为企业构建更加动态、可靠和高效的分布式系统提供策略指导。
|
3天前
|
边缘计算 Cloud Native 持续交付
云原生技术的未来展望:构建更加动态和灵活的IT基础设施
【5月更文挑战第23天】 随着云计算的不断演进,云原生技术正成为推动企业数字化转型的关键驱动力。本文深入探讨了云原生的核心概念、关键技术以及在现代IT基础设施中实现敏捷性、可扩展性和弹性的重要性。通过分析容器化、微服务架构、持续集成和持续部署(CI/CD)等技术实践,文章揭示了如何利用云原生方法来优化资源利用率,加速开发周期,并确保系统的稳定性和安全性。此外,文中还提出了对未来云原生发展趋势的预测,包括无服务器计算、自动化运维和边缘计算的融合,为企业采纳云原生技术提供了战略性的视角。