快递行业双11重保护航-阿里云开发者社区

开发者社区> 阿里云SRE技术社区> 正文
登录阅读全文

快递行业双11重保护航

简介: 快递行业双11重保护航

快递行业双11重保护航

项目简介

今年双十一双高峰、长周期,寄递规模达到新的历史高峰,集包作业推广和自动化设备大量增加,对寄递平台的信息处理能力要求更高;对系统算力要求更高、压力更大。云平台承载客户核心业务,任务艰巨,责任重大。
针对此次旺季重保和四季度收尾工作,客户提出四大目标:促发展、保畅通、重体验、保稳定。在明确这一重保目标前提下,与行业对标,全面应用自动化运维手段,梳理系统痛点难点问题,提升信息用户体验。我们的目标是确保“业务不中断,系统不宕机”。

项目成果

此次重保护航从10月31日至18日共19天,历经两次双11旺季业务高峰,阿里云智能与客户联合作战,从云平台稳定性治理、应急预案、产品升级、订单容灾、场景展示、智能工具、故障演练、能力基线等方面进行了充分的准备。其中:完成了三轮深度治理,80多个专项,完成1400多项云产品调优;制定了16个应急预案,确保出现应用级问题,可以快速定位解决;完成了54款组件与产品升级,30+个风险修复;针对新一代寄递订单业务,制定了应用级订单容灾兜底方案,确保出现平台级故障,订单业务系统可以正常使用,为客户核心业务上一份双保险;设计了云平台保障大盘,业务系统保障大盘和应用拓扑保障大盘,全方位展示系统,业务运行状况;利用全链路诊断工具,封神榜钉钉推送及SRE运维大脑等自动化、智能化工具手段,协助客户快速定位问题,分析问题;为保障应急效率,现场执行了4次故障演习,2次VPN接入演练,规范故障处理流程提升驻场故障应急响应能力;专家团队与客户项目组联合压测,建立了213个应用系统接口性能基线,评估业务承载。

项目总结

整个双十一重保期间,阿里产品研发、性能优化专家、一线驻场运维通力合作,7*24小时现场值守,为客户云平台保驾护航,秉承客户为先,业务第一原则,遇到问题冲在一线,实现业务全程0故障、0影响、0重要事件、0应急。在重保现场,阿里各专家站在客户业务应用角度,帮助客户分析解决问题,并不仅限于产品保障,让客户切实感受到了阿里“客户第一”的文化与工作风格,得到了客户领导与直属客户负责人的高度认可与表扬,圆满完成此次护航保障工作。

![1.png](https://ucc.alicdn.com/pic/developer-ecology/0be5c09803b54f4f872c371640c1ee7e.png)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

阿里云智能全球技术服务部SRE团队,是阿里集团高可用基础技术核心缔造团队,也是阿里为确保客户平台稳定、业务连续而打造的核心支撑团队

官方博客
官网链接