考拉海购全面云原生迁移之路

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 今年 8 月底,入驻“阿里动物园”一周年的考拉海购首次宣布战略升级,在现有的跨境业务基础上,将重点从以“货”为中心变成以“人”为中心,全面发力会员电商。

image.png
今年 8 月底,入驻“阿里动物园”一周年的考拉海购首次宣布战略升级,在现有的跨境业务基础上,将重点从以“货”为中心变成以“人”为中心,全面发力会员电商。

外界不知道的是,对考拉海购来说,不只是完成了业务升级,目前考拉已全面拥抱云原生,大幅提升运维效率,并加速业务的迭代升级。考拉海购技术负责人谢聘超在云栖大会演讲中分享了考拉海购的云原生迁移之路,以下是演讲内容整理。

今年年初,我们就完成了考拉全部迁移至阿里云。但我们认为这还不够,又给自己定了新的 KPI ,9 月之前让所有的应用拥抱云原生。
image.png

迁移融合,与时间赛跑

20亿美元收购网易考拉,在阿里的收购历史上,既不是最大,也不是最难的。但半年完成整合、未满一年提出战略升级,在阿里的历史上从未有过。

快速的整合升级首先是由技术驱动的。

这一年多我们都在跟时间赛跑。

在迁移过程中,必须保证业务不受损、全部线上服务全程可用。但现实是,原机房距离太远,导致每一次的网络传输大概有 50 毫秒的延时,给不停服迁移带来了巨大的困难。
image.png
当时想到了一个比较完美的解决方案,在机房间挖了一条光纤,并建立了考拉独立的VPC,进行数据同步。既让网络流畅互通,又保证了数据安全。但是困难又来了。如果慢慢切换,流量先放 1% 、再放 5% 、再放 10% ,对于用户体验来说,损伤很大。试想,如果客户下一个单需要3秒钟,客服电话就要被打爆了。

疫情期间,考拉海购团队紧急进行内测。把各个环节、所有的测试链路分批全部进行了测试,保证了整个链路的完整性。那个夜晚真的是提心吊胆。必须保证没有灰度,才能做切换。

最终,考拉海购全量完成了迁移,性能没有出现任何问题。整个迁移过程比较稳定顺滑,到了阿里云,云网络这块也放心多了。

考拉海购 100% 全站迁移至阿里云后,稳定支撑了今年 3.8 女神节大促。这是考拉迁移上云后的首个大促,当天流量峰值较 2019 年双 12 增长了 72% ,但相比之前成本大幅度降低。考拉海购各业务线也在当天被证明 100% 打通,形成闭环。

整个迁移过程中,阿里云提供了很大的帮助。阿里云 EPC 安全方案、数据迁移方案非常成熟。此外,阿里云整体的能力支撑也很完整,迁移数据库、 ES 的成本很低,没有出现不兼容的情况。

阿里云提供了一个很强的功能,叫有状态的容器。以前的迁移是容器迁过来,IP地址就丢掉了。有了有状态的容器,可以保持 IP 地址不变。此外,阿里云产品提供了便捷的界面,可自助操作。这些产品优势对效率提升和成本节约的价值极其巨大。

下一步,全面拥抱云原生

完成了第一阶段的目标之后,考拉海购开始了全面的云原生之路。
image.png
云原生帮助考拉海购在运维效率上有了大幅提升。云原生产品提供了众多 API ,可以基于产品的运维接口进行组合,开发出系统,整体运维变得非常灵活。

在弹性上,考拉海购主要关注两方面,一是大促前后的弹性,二是白天高峰期和晚上低峰期的弹性。第一点比较常见,第二点借助于阿里云的弹性能力,也可以实现单日内的弹性收缩,对日常成本的节约非常有效。
image.png
在容灾方便,阿里云原生产品天然多 AZ 容灾能力,极大地加速了考拉海购同城多活能力的建设,因此考拉海购才能在短时间内很快扩展到多机房,并具备多AZ的容灾能力。

其次,基于 ARMS 和 PTS ,在业务不改造的情况下(个别特殊逻辑除外),就能完成全链路压测能力的接入,增量业务也可以零成本接入全链路压测,解决了业务监测和问题排查层面的诸多难题。

这就是阿里云天然的优势,因为这些云产品经过了历年双十一的检测,所要面临的问题场景和复杂度也是业界最难的,能经得住这些场景的考验,才历练了阿里云产品的能力。

用一年多时间重新出发,考拉海购如今走出了一条创新路径,成为国内首屈一指的会员电商平台。来自考拉海购官方的数据显示,截至 2020 年 6 月 30 日,考拉海购会员规模同比增长 23% 。会员凸显出高客单、高活跃、高复购的特点:会员年客单价是非会员的 7.3 倍,月度活跃是非会员的 2.4 倍,年订单数是非会员的 4 倍。

相关文章
|
16天前
|
运维 Cloud Native Java
热联集团:从 APISIX 迁移到云原生网关
我们将核心业务系统从 IDC 全栈迁移到阿里云后,并采用了云原生 API 网关,通过其独有的软硬一体的加速方案,相比普通 HTTPS 请求 TLS 握手时延降低一倍,极限 QPS 提升 80% 以上,运维效率也提升了 50%,此外,我们把 Nacos 迁移到 MSE Nacos,稳定性、性能和运维成本等方面都具备了明显的优势。
|
5月前
|
SQL Cloud Native 关系型数据库
云原生数据仓库使用问题之如何实现adb到adb的整库迁移或同步
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
分布式计算 Cloud Native 大数据
阿里云最新产品手册——阿里云核心产品——云原生大数据计算服务——迁移到MaxCompute
阿里云最新产品手册——阿里云核心产品——云原生大数据计算服务——迁移到MaxCompute自制脑图
148 1
|
容灾 Cloud Native 数据库
《云迁移与云容灾-云上数据库迁移与云原生容灾》电子版地址
云迁移与云容灾-云上数据库迁移与云原生容灾
74 0
《云迁移与云容灾-云上数据库迁移与云原生容灾》电子版地址
|
Kubernetes Cloud Native 安全
两类常见场景下的云原生网关迁移实践
本文将基于 MSE 云原生网关,介绍两类场景下的云原生网关迁移实践,第一类,是自建 Nginx Ingress 迁移到 MSE,我们提供了不更改原有 SLB,便可实现不停机迁移的能力,控制迁移风险,将对此将展开详细介绍;第二类是传统的微服务网关迁移到 MSE,我们通过提供详细的操作文档来说明。
两类常见场景下的云原生网关迁移实践
|
Cloud Native Devops
《考拉云原生DevOps大规模落地实践》电子版地址
《考拉云原生DevOps大规模落地实践 》
153 0
《考拉云原生DevOps大规模落地实践》电子版地址
|
Kubernetes Cloud Native 安全
两类常见场景下的云原生网关迁移实践
云原生网关将流量网关、微服务网关、安全网关三合一,被誉为下一代网关,完全兼容 Kubernetes Ingress 标准 API,解决了三层网关架构独立设计、独立运维导致的资源消耗大、性能损耗大、稳定性难控、安全防护复杂等难题,相比传统网关,云原生网关在资源成本、性能、安全性和易用性上更有优势。
两类常见场景下的云原生网关迁移实践
|
运维 Kubernetes Cloud Native
应用容器化迁移与云原生的探索|商派运维团队
云原生化使得应用增益良多,实践和探索云原生是未来很长一段时间需要走的路线,云原生究其本质,凡是能够提高云上资源利用率和应用交付效率的行为或方式都是云原生。
应用容器化迁移与云原生的探索|商派运维团队
|
存储 Kubernetes 监控
快速云原生化,从数据中心到云原生的迁移最佳实践
本文将介绍在帮助用户快速完成迁云中的解决方案、最佳实践以及迁云工具。
快速云原生化,从数据中心到云原生的迁移最佳实践
|
消息中间件 监控 Cloud Native
亲历者说 | 完整记录一年多考拉海购的云原生之路
考拉海购的整个云化改造是从 2019 年 10 月份开始的,当时的唯一目标就是短时间内快速完成迁移。在不到 4 个月的时间里,考拉团队唯一考虑的是如何以最快的速度完成使命,云原生是我们选择的最合适的一条路。
亲历者说 | 完整记录一年多考拉海购的云原生之路