考拉海购全面云原生迁移之路

本文涉及的产品
MSE Nacos/ZooKeeper 企业版试用,1600元额度,限量50份
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
注册配置 MSE Nacos/ZooKeeper,182元/月
简介: 今年 8 月底,入驻“阿里动物园”一周年的考拉海购首次宣布战略升级,在现有的跨境业务基础上,将重点从以“货”为中心变成以“人”为中心,全面发力会员电商。

image.png
今年 8 月底,入驻“阿里动物园”一周年的考拉海购首次宣布战略升级,在现有的跨境业务基础上,将重点从以“货”为中心变成以“人”为中心,全面发力会员电商。

外界不知道的是,对考拉海购来说,不只是完成了业务升级,目前考拉已全面拥抱云原生,大幅提升运维效率,并加速业务的迭代升级。考拉海购技术负责人谢聘超在云栖大会演讲中分享了考拉海购的云原生迁移之路,以下是演讲内容整理。

今年年初,我们就完成了考拉全部迁移至阿里云。但我们认为这还不够,又给自己定了新的 KPI ,9 月之前让所有的应用拥抱云原生。
image.png

迁移融合,与时间赛跑

20亿美元收购网易考拉,在阿里的收购历史上,既不是最大,也不是最难的。但半年完成整合、未满一年提出战略升级,在阿里的历史上从未有过。

快速的整合升级首先是由技术驱动的。

这一年多我们都在跟时间赛跑。

在迁移过程中,必须保证业务不受损、全部线上服务全程可用。但现实是,原机房距离太远,导致每一次的网络传输大概有 50 毫秒的延时,给不停服迁移带来了巨大的困难。
image.png
当时想到了一个比较完美的解决方案,在机房间挖了一条光纤,并建立了考拉独立的VPC,进行数据同步。既让网络流畅互通,又保证了数据安全。但是困难又来了。如果慢慢切换,流量先放 1% 、再放 5% 、再放 10% ,对于用户体验来说,损伤很大。试想,如果客户下一个单需要3秒钟,客服电话就要被打爆了。

疫情期间,考拉海购团队紧急进行内测。把各个环节、所有的测试链路分批全部进行了测试,保证了整个链路的完整性。那个夜晚真的是提心吊胆。必须保证没有灰度,才能做切换。

最终,考拉海购全量完成了迁移,性能没有出现任何问题。整个迁移过程比较稳定顺滑,到了阿里云,云网络这块也放心多了。

考拉海购 100% 全站迁移至阿里云后,稳定支撑了今年 3.8 女神节大促。这是考拉迁移上云后的首个大促,当天流量峰值较 2019 年双 12 增长了 72% ,但相比之前成本大幅度降低。考拉海购各业务线也在当天被证明 100% 打通,形成闭环。

整个迁移过程中,阿里云提供了很大的帮助。阿里云 EPC 安全方案、数据迁移方案非常成熟。此外,阿里云整体的能力支撑也很完整,迁移数据库、 ES 的成本很低,没有出现不兼容的情况。

阿里云提供了一个很强的功能,叫有状态的容器。以前的迁移是容器迁过来,IP地址就丢掉了。有了有状态的容器,可以保持 IP 地址不变。此外,阿里云产品提供了便捷的界面,可自助操作。这些产品优势对效率提升和成本节约的价值极其巨大。

下一步,全面拥抱云原生

完成了第一阶段的目标之后,考拉海购开始了全面的云原生之路。
image.png
云原生帮助考拉海购在运维效率上有了大幅提升。云原生产品提供了众多 API ,可以基于产品的运维接口进行组合,开发出系统,整体运维变得非常灵活。

在弹性上,考拉海购主要关注两方面,一是大促前后的弹性,二是白天高峰期和晚上低峰期的弹性。第一点比较常见,第二点借助于阿里云的弹性能力,也可以实现单日内的弹性收缩,对日常成本的节约非常有效。
image.png
在容灾方便,阿里云原生产品天然多 AZ 容灾能力,极大地加速了考拉海购同城多活能力的建设,因此考拉海购才能在短时间内很快扩展到多机房,并具备多AZ的容灾能力。

其次,基于 ARMS 和 PTS ,在业务不改造的情况下(个别特殊逻辑除外),就能完成全链路压测能力的接入,增量业务也可以零成本接入全链路压测,解决了业务监测和问题排查层面的诸多难题。

这就是阿里云天然的优势,因为这些云产品经过了历年双十一的检测,所要面临的问题场景和复杂度也是业界最难的,能经得住这些场景的考验,才历练了阿里云产品的能力。

用一年多时间重新出发,考拉海购如今走出了一条创新路径,成为国内首屈一指的会员电商平台。来自考拉海购官方的数据显示,截至 2020 年 6 月 30 日,考拉海购会员规模同比增长 23% 。会员凸显出高客单、高活跃、高复购的特点:会员年客单价是非会员的 7.3 倍,月度活跃是非会员的 2.4 倍,年订单数是非会员的 4 倍。

相关文章
|
6月前
|
JavaScript Linux Python
在Linux服务器中遇到的立即重启后的绑定错误:地址已被使用问题解决
总的来说,解决"地址已被使用"的问题需要理解Linux的网络资源管理机制,选择合适的套接字选项,以及合适的时间点进行服务重启。以上就是对“立即重启后的绑定错误:地址已被使用问题”的全面解答。希望可以帮你解决问题。
361 20
|
Linux 数据安全/隐私保护
CentOS 7 - 创建新用户
当进行服务器操作时,我们尽量不要使用root用户进行操作,特别是当我们使用生产环境时。 本文我们将介绍CentOS 7下用户的创建。
11894 0
|
7月前
|
安全 IDE Java
重学Java基础篇—Java泛型深度使用指南
本内容系统介绍了Java泛型的核心价值、用法及高级技巧。首先阐述了泛型在**类型安全**与**代码复用**中的平衡作用,解决强制类型转换错误等问题。接着详细讲解了泛型类定义、方法实现、类型参数约束(如边界限定和多重边界)、通配符应用(PECS原则)以及类型擦除的应对策略。此外,还展示了泛型在通用DAO接口、事件总线等实际场景的应用,并总结了命名规范、边界控制等最佳实践。最后探讨了扩展知识,如通过反射获取泛型参数类型。合理运用泛型可大幅提升代码健壮性和可维护性,建议结合IDE工具和单元测试优化使用。
214 1
|
11月前
|
运维 Cloud Native 虚拟化
一文吃透云原生 Docker 容器,建议收藏!
本文深入解析云原生Docker容器技术,涵盖容器与Docker的概念、优势、架构设计及应用场景等,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
一文吃透云原生 Docker 容器,建议收藏!
|
JSON 测试技术 数据格式
性能工具之 Locust 工具 Get 与 Post 请求
【4月更文挑战第7天】性能工具之 Locust 工具 Get 与 Post 请求
169 1
|
Kubernetes 负载均衡 网络协议
k8s学习--负载均衡器matelLB的详细解释与安装
k8s学习--负载均衡器matelLB的详细解释与安装
857 0
|
Java API 计算机视觉
图像处理之添加高斯与泊松噪声
图像处理之添加高斯与泊松噪声
256 1
|
JavaScript 前端开发 Java
Java11 新特性深度解析
Java11 新特性深度解析
深度分析:EDPB关于GDPR下行政罚款计算的指南V2.1
2022年5月12日,EDPB通过了关于GDPR下行政罚款计算的指南V2.1《Guidelines 04/2022 on the calculation of administrative fines under the GDPR(Version 2.1)》(下称“04/2022号指南”),以统一监管机构在计算罚款金额时使用的方法。04/2022号指南是对2017年第29条工作组关于行政罚款申请和设定的指南(WP253)的补充。而WP253指南侧重于罚款的适用情形。
323 0
|
缓存 前端开发 rax
测试cache访问延迟背后的计算机原理
CPU的cache往往是分多级的金字塔模型,如何在多级cache中测试cache的延迟?
1565 2
测试cache访问延迟背后的计算机原理