如何站在双11的肩膀上 详解阿里云企业级互联网架构

简介:

摘要:2015天猫双11全球狂欢节以912.17亿元的答卷完美收官。双11当天14万笔/秒的交易创建峰值和8.6万笔/秒的支付峰值双双刷新了世界纪录,相比首届双11,订单创建峰值增长了350倍,支付峰值增长了430倍。天量数字的背后,是中国计算能力的登顶全球。 阿里云计算总裁胡晓明表示,阿里巴巴承载双11的计算能力和...


2015天猫双11全球狂欢节以912.17亿元的答卷完美收官。双11当天14万笔/秒的交易创建峰值和8.6万笔/秒的支付峰值双双刷新了世界纪录,相比首届双11,订单创建峰值增长了350倍,支付峰值增长了430倍。天量数字的背后,是中国计算能力的登顶全球。

阿里云计算总裁胡晓明表示,阿里巴巴承载双11的计算能力和技术正在通过阿里云加速向外输出,通过标准化的产品和服务,完全可以搭建一个像淘宝、天猫这样的万亿级企业应用,满足任何极端的业务挑战。

近日,阿里云资深技术专家沈询向外详细披露了阿里云企业级互联网架构,正是这套被称为“双11背后男人”的架构体系,撑起了912亿的天量交易,这套系统也正被中国石化等大型企业视为互联网转型的基石。

阿里巴巴技术架构全方位曝光

每年的双11,天猫、淘宝都有很多新玩法,要保证新玩法快速响应,又要保证大促期间系统稳定,阿里云到底是用什么技术架构来支撑多样化的业务呢?

沈询表示,阿里的系统自上而下分为5个层面,分别是业务逻辑展现层、业务能力运营层、云化业务能力层、企业级互联网架构能力层和阿里云基础设施。


其中最为关键的是云化业务能力层的积累。例如,淘宝内有类似商品,交易,评价这样的共享能力中心,当新应用中有类似业务时都会使用这些能力中心来完成新功能,而每个能力中心都由专门的开发团队来负责。“让专业的团队做专业的事”,团队的协调成本可以有效控制,开发效率得到了显著地提升。这些业务能力的积累也逐渐成为了阿里最重要的竞争力,发展新业务时,只需在既有存量能力的基础上,开发增量部分就可以完成业务,节省了大量开发资源。

5年完成服务化改造 提供10万+服务化接口

在过去的五年时间里,阿里内部的所有系统已经全部完成了服务化改造,并且通过能力开放平台对外提供统一的接口服务。目前,整个阿里巴巴的业务能力平台已经积累了千个应用,提供了十几万个服务化接口。

沈询指出,阿里与其他企业最大的不同在于其底层平台的技术支撑。在创业之初,阿里也选择了购买成熟的企业级应用技术来解决架构问题。然而在实践中,阿里很快就发现传统架构在面对互联网应用时明显力不从心。

因此,针对快速开发、海量用户、大量数据、低延迟等互联网应用的实际需要,阿里云分别开发了企业级分布式应用服务框架(EDAS),分布式数据库服务(DRDS)和分布式消息框架(ONS)等来应对复杂的业务应用。经过多年积累,如今这个架构已经非常成熟,并在历年的双11时期经受住了考验。

阿里云企业级互联网架构的五大特征

互联网时代,企业的核心就是效率。沈询表示,阿里云企业级互联网架构为用户提供的最核心价值,在于随着系统机器数量的不断增加,处理性能呈线性上升,可靠性呈指数级上升,而运营成本不会随着机器的增加而显著增加。

为了实现这个价值,阿里云企业级互联网架构呈现了去服务化、中心化、异步化、高可用、数据化运营等五大特征。

具体来说,服务化的技术体系提供企业级分布式应用框架(EDAS)来实现原有业务面向互联网服务化改造,改变企业内竖井式、烟囱式的系统建设。让应用开发周期更短,并且能够让IT应用系统进一步的促进业务发展。

同时,阿里云采用了去中心化架构,没有核心流量汇入点,这样带来的负载更小,故障影响的范围也更小。


然而,去中心化也会面对系统运维和管理成本的上升的问题。而阿里云经过数千个应用近10年的不断锤炼和试错,已经从一个个充满血泪的运营故障中积累了一套数据化、自动化运维的经验,能够大幅降低去中心化应用系统的运营成本。

沈询表示,在大量的实践中,只有很少的部分业务流程需要使用到强一致的方案。而在大部分场景中,阿里云都可以依托分布式消息服务(ONS),通过异步化、最终一致的方案来完成业务逻辑。以双11为例,完成一次交易动作需要调用200多个应用系统同时完成,假设每个系统需要10毫秒才能返回,那么整条链路就需要2秒钟才能完成调用过程,再结合前端延迟,总时长或超3秒。数据显示,每增加1秒延迟,就会有流失6%的用户。而异步化系统能有效改善该现象,只要保证三个应用的同步调用保证,其他非重要的系统可并行在后端异步完成,最后用户体感的延迟将从原有的2秒直接下降到30ms,用户流失率将大幅降低。

在云计算环境下,阿里云使用了成千上万个虚拟机来负载业务,并对自动化提出了更高的要求。阿里云研发的,分布式数据库服务(DRDS),分布式消息服务(ONS)都能以自动化的形式实现系统的秒级切换和快速恢复,对应用几乎没有影响。

大数据时代离不开数据化运营,除了上述几点,阿里云企业级互联网架构的服务层(DRDS\EDAS\ONS)都具备了成熟的数据化运营体系,能够帮助用户精准定位目前系统中存在的问题,并提出相应的改善方案。

上述五大特征,铸就了阿里云企业级互联网应用架构平台,沈询表示,该架构已经基本成为了企业内各类业务的标配,除了多年来在天猫、淘宝上的出色表现,P2P领域的红岭创投,CRM领域的网聚宝以及大型国有企业中国石化等,都借助阿里云企业级互联网架构,轻松实现了完全去中心化和异步化,在控制成本的情况下实现性能和可用性的线性提升。

每一年双11都是消费者的狂欢,同时也是一场技术盛宴。沈询表示,阿里云正逐步对外开放架构,越来越多的大型企业正在加入到互联网转型的队伍中来,轻松拥抱云服务,构建像淘宝这样的大型分布式应用服务,快速实现业务创新、资源效率最大化。

相关实践学习
微服务实战-服务注册中心 - Nacos
Nacos是阿里巴巴于2018年7月发布的一个开源项目,它是一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。Nacos 支持几乎所有主流类型的服务的发现、配置和管理: Kubernetes Service  gRPC & Dubbo RPC Service  Spring Cloud RESTful Service  
目录
相关文章
|
2月前
|
存储 数据挖掘 BI
2-5 倍性能提升,30% 成本降低,阿里云 SelectDB 存算分离架构助力波司登集团实现降本增效
波司登集团升级大数据架构,采用阿里云数据库 SelectDB 版,实现资源隔离与弹性扩缩容,查询性能提升 2-5 倍,总体成本降低 30% 以上,效率提升 30%,助力销售旺季高效运营。
159 9
|
2月前
|
存储 弹性计算 运维
AI时代下阿里云基础设施的稳定性架构揭秘
计算、存储、网络作为云计算基础 IaaS 服务,一直是阿里云的核心产品,承载着百万客户的 IT 基础设施。曾经我们认为应用高可用、服务分布式可以满足客户对 IaaS 所有的稳定性诉求。
323 2
AI时代下阿里云基础设施的稳定性架构揭秘
|
26天前
|
数据采集 运维 监控
构建企业级Selenium爬虫:基于隧道代理的IP管理架构
构建企业级Selenium爬虫:基于隧道代理的IP管理架构
|
4月前
|
消息中间件 运维 监控
企业级短信验证码服务架构设计与最佳实践
随着移动互联网的发展,短信验证码成为用户身份验证的重要手段。本文从企业级应用角度出发,探讨如何构建高可用、高并发和安全可靠的短信验证码服务。通过多通道冗余、故障自动切换和服务降级保障高可用性;利用异步处理与消息队列应对高并发;借助多层防刷、内容审核和数据加密提升安全性。同时,提供了详细的架构设计、核心模块代码示例以及监控运维方案,帮助读者理解并实现一个完整的短信验证码系统。
201 2
|
6天前
|
人工智能 缓存 安全
阿里云发布《AI 原生应用架构白皮书》
阿里云联合阿里巴巴爱橙科技,共同发布《AI 原生应用架构白皮书》,围绕 AI 原生应用的 DevOps 全生命周期,从架构设计、技术选型、工程实践到运维优化,对概念和重难点进行系统的拆解,并尝试提供一些解题思路。白皮书覆盖 AI 原生应用的 11 大关键要素,获得 15 位业界专家联名推荐,来自 40 多位一线工程师实践心的,全书合计超 20w 字,分为 11 章。
|
7天前
|
人工智能 Cloud Native 安全
解读阿里云刚发布的《AI 原生应用架构白皮书》
阿里云在云栖大会重磅发布了《AI 原生应用架构白皮书》,该白皮书覆盖 AI 原生应用的 11 大关键要素,获得业界 15 位专家联名推荐,来自 40 多位一线工程师实践心得,全书合计超 20w 字,分为 11 章,全面、系统地解构 AI 原生应用架构,包含了 AI 原生应用的 11 大关键要素,模型、框架、提示词、RAG、记忆、工具、网关、运行时、可观测、评估和安全。本文整理自阿里云智能技术专家李艳林在云栖大会现场的解读。
|
4月前
|
存储 SQL 分布式计算
19章构建企业级大数据平台:从架构设计到数据治理的完整链路
开源社区: 贡献者路径:从提交Issue到成为Committer 会议演讲:通过DataWorks Summit提升影响力 标准制定: 白皮书撰写:通过DAMA数据治理框架认证 专利布局:通过架构设计专利构建技术壁垒
|
1月前
|
存储 分布式计算 资源调度
【赵渝强老师】阿里云大数据MaxCompute的体系架构
阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。
103 1
|
17天前
|
存储 消息中间件 安全
企业级实时消息推送系统的架构设计,一文即懂!
如果你是技术负责人,该如何搭建一套能解决这些问题的企业级统一消息推送平台?今天我们就从核心挑战出发,拆解一套可落地的统一推送服务架构方案。
125 0

热门文章

最新文章