申通完美支撑“双11”亿级包裹背后的云基础设施

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 阿里云基础设施首次支撑申通全站业务系统,申通的双 11 平稳顺滑,展现了无限潜力。

前言

今年双11,申通的系统前所未有的流畅与平稳。

“双11全站跑在阿里云上,亿级包裹洪峰过境,千万级订单毫秒级响应,系统稳如泰山。” 申通上云的技术负责人方遥难掩骄傲地说。

“11月1日凌晨第一波订单高峰到来,整个系统的响应很快,面对超过日常数倍的接单量,系统的响应时间没有变化;在接单、自动化分拣、巴枪扫描、快件跟踪等核心指标上表现稳定;相应的中间件、数据库资源的负载也在合理的区间范围内波动。”方遥在接受媒体采访时表示。

这让他对第二波订单高峰信心满满,上云后的申通系统没有让他失望。

11月6日,方遥盯着屏幕上稳定运行的后台系统,像看自己的孩子。从8月进入双11备战,将近三个月的时间,经历了无数次压测,双11第一波结束,才算轻松下来。作为申通上云负责人,他长久的努力,也在此刻得到了最大的回报。

上云前,申通使用线下机房作为计算及数据存储平台,一到双11资源需求就膨胀,大促之后则闲置浪费;上云后,几乎全部的资源都是按量购买,用完双11就释放,真正做到了开箱即用,不产生一天浪费。与去年双11当天相比,今年11月1到3日,相比此前传统IDC架构方案,在业务量大幅提升的情况下,IT投入反而降低了30%。上云的成效显著。

全站应用容器化,弹性调度稳定高效

在设计全站上云方案之初,方遥就果断决定拥抱云原生并将所有应用100%容器化,技术转型的决策,是来自其强烈的危机感,2019年快递行业业务量达到600亿件,申通业务量达到73亿件,开始向百亿件规模挺进。

选用阿里云容器服务ACK和容器镜像服务ACR,可以为申通带来两大重要好处:业务快速上线、开箱即用的可靠弹性。

在这个快速多变的时代,企业业务“唯快不破”。通过云原生技术可以做到快速上线部署,为团队培养出应用开发与运维的规范化操作,形成了将应用代码打包成容器镜像再到K8s标准化部署的流程,不再需要耗费大量时间人肉发布、也避免了因集群配置不一致而发生故障等问题,成功转型DevOps驱动公司。

其次,快递的业务是非常典型的周期性业务,在业务爆发式增长的时候,资源如何做到开箱即用?而业务突发增长,哪有比双11更具代表的时期呢,今年双11就是申通是弹性调度的绝佳试验场。

当然容器与Kubernetes技术带来的还有更多:依赖Kubernetes为核心的数据中心通过应用编排、业务故障自愈的能力让整个系统更稳;通过监控埋点、业务日志收集、链路监控等手段保证了在快速迭代过程中业务系统的稳定性;通过对计算资源的水位监测,结合业务的峰值情况,弹性扩缩容或降低配规格数量,可以降低整个资源的费用等等。

这个云原生化全站迁云的战役,一场耗时一年有余。

经过数不胜数的需求沟通与技术改造,在申通与阿里云同学们的不断努力下,申通最终成功实现采用云原生技术和架构实现核心业务搬迁上阿里云。

这个决策,为今年双11技术创新埋下了伏笔:比如,应用弹性伸缩大大降低计算成本,一年节省数百万;又比如,快速上线更多创新业务,今年双11的预售商品提前下沉到用户附近,楼上下单楼下发货,提升顾客体验。

“上云只是一个开端,云只是基础设施。”方遥说,“申通的技术架构会朝着下一代微服务架构Mesh演进,提升复杂系统的可治理性。”

阿里云神龙裸金属方案,支撑申通平滑渡过双11

申通核心业务系统原架构基于 VMware+Oracle 数据库进行搭建。随着搬迁上阿里云,架构全面转型为基于 Kubernetes 的云原生架构体系。其中,引入云原生数据库并完成应用基于容器的微服务改造是整个应用服务架构重构的关键点。

综合考虑申通实际业务需求与技术特征,最终选择了「阿里云 ACK+ 神龙裸金属 + 云数据库」的云原生解决方案,实现核心应用迁移上阿里云。

b.png

阿里云ACK+神龙裸金属方案,于2020年609云峰会上重磅发布。申通云原生上云的基础设施,就全部使用了阿里云的神龙裸金属服务器。相较于一般云服务器(ECS),Kubernetes 搭配神龙服务器能够获得更优性能及更合理的资源利用率且云上资源按需取量,对于拥有大促活动等短期大流量业务场景的申通而言极为重要。

c.png

首先,云原生裸金属方案,可以满足业务快速发放和弹性的要求。神龙裸金属服务器可分钟级完成实例创建和启动,并利用Kubernetes的调度和编排能力,通过阿里云容器K8S服务与阿里云基础设施的紧密协同(SLB, VPC, NAS, SLS等等),在非常短的时间内,支持业务极速部署,轻松应对瞬时峰值场景对系统敏捷性的要求。

第二, 神龙裸金属的性能,加上容器的弹性,形成了天作之合。“容器+神龙裸金属”的解决方案非常契合像双11这种大流量、高并发的场景。

神龙裸金属是云原生的最佳载体,它规格较高,可以实现高密度容器部署。同时,神龙服务器的性能优势明显, 它完全消除了虚拟化损耗,提升8%的计算性能,其类物理机特性,可进行二次虚拟化。新一代容器服务 ACK,可以将最新神龙弹性裸金属实例的强大性能发挥得淋漓尽致。

数据显示,容器运行在云上神龙反而比非云物理机的性能要好10%-15%。因为神龙云服务器不仅无虚拟化开销,而且运行在神龙上的每个容器都可以独享弹性网卡ENI,能提升13%的网络吞吐量。

结语

如果说,快递行业上半场的竞争拼的是规模、服务乃至价格,进入下半场,快递企业们还需要比拼硬核的技术实力。

阿里云基础设施首次支撑申通全站业务系统,申通的双11平稳顺滑,展现了无限潜力。

在申通内部看来,“双11”的逆袭也意味着被申通称为数字化1.0的阶段全部完成。在技术的最终规划中,跨过2.0达到达数字化3.0,必须构建起一个申通大脑,这个大脑不仅包揽一切,还可以自我迭代,是申通智能人格的终极象征,这才是申通自动化转型的终极目标。

参考文章:
双11即将开启第二波 申通跑在阿里云上怎么样?

迎战超长待机“双11” 申通为何选择数字化转型这剂猛药?

申通快递全面迁移阿里云 成快递全面上云第一家

阿里云发布云原生裸金属方案:裸金属+容器,解锁云计算的新方式

停课不停学,阿里云“神龙+容器”帮助在线教育企业构建高质量课堂

申通和民生银行入选信通院云原生应用十大优秀案例,揭秘云原生与数据中台的正确打开方式

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
目录
相关文章
|
8月前
|
前端开发 搜索推荐 数据挖掘
推三返一模式开发案例
推三返一模式是一种创新的营销策略,其核心是鼓励现有用户推荐新用户注册或购买,以实现用户基数的快速增长和品牌影响力的提升。以下是对推三返一模式开发的详细解析:
|
数据可视化 Scala Python
Jupyter 在教育领域的应用与影响
【8月更文第29天】随着数字技术和互联网的发展,教育行业正在经历一场深刻的变革。传统的面对面教学模式逐渐被更加灵活和高效的方式所补充或替代。其中,Jupyter Notebook 作为一种开放源代码的 Web 应用程序,为教学提供了强大的工具,尤其是在 STEM(科学、技术、工程和数学)领域。本文将探讨 Jupyter 在教育中的应用以及它如何改变了教学方式,并提供一些实际的代码示例来展示其功能。
266 1
|
Java
java -jar 命令隐藏黑窗口
java -jar 命令隐藏黑窗口
529 0
|
Ubuntu 开发工具 git
ESP32-C3 VScode开发环境搭建(基于ESP-IDF—Windows和Ubuntu双环境)
对于ESP32-C3开发,自己对Arduino环境使用起来很是不习惯,既然乐鑫官方都出对应的环境,还是来试试官方环境
3214 0
ESP32-C3 VScode开发环境搭建(基于ESP-IDF—Windows和Ubuntu双环境)
|
数据采集 机器学习/深度学习 算法
Python实现AdaBoost分类模型(AdaBoostClassifier算法)项目实战
Python实现AdaBoost分类模型(AdaBoostClassifier算法)项目实战
|
开发框架 人工智能 API
魔搭社区推出ModelScope-Agent开发框架,打造属于你的智能体
魔搭社区推出适配开源大语言模型(LLM)的AI Agent(智能体)开发框架ModelScope-Agent。
魔搭社区推出ModelScope-Agent开发框架,打造属于你的智能体
|
消息中间件 监控 Cloud Native
阿里云发布性能测试 PTS 2.0:低成本、高效率、多场景压测,业务稳定性保障利器
618 来临,高峰时段的品牌直播间要同时容纳几百万人线上发弹幕、抢货、抢红包,如此大的用户体量、高频交互以及脉冲流量场景,对于后端服务器来说都是不小的挑战。 为了确保线上稳定性以及优质的交互体验,通过性能测试 PTS(Performance Testing Service)进行压测成为很多平台和品牌商的首选。
阿里云发布性能测试 PTS 2.0:低成本、高效率、多场景压测,业务稳定性保障利器
|
Oracle 关系型数据库 数据库
Oracle 系统表大全
数据字典dict总是属于Oracle用户sys的。  1、用户:   select username from dba_users;  改口令   alter user spgroup identified by spgtest;  2、表空间:   select * from db...
1105 0