今年 8 月底,入驻“阿里动物园”一周年的考拉海购首次宣布战略升级,在现有的跨境业务基础上,将重点从以“货”为中心变成以“人”为中心,全面发力会员电商。
外界不知道的是,对考拉海购来说,不只是完成了业务升级,目前考拉已全面拥抱云原生,大幅提升运维效率,并加速业务的迭代升级。考拉海购技术负责人谢聘超在云栖大会演讲中分享了考拉海购的云原生迁移之路,以下是演讲内容整理。
今年年初,我们就完成了考拉全部迁移至阿里云。但我们认为这还不够,又给自己定了新的 KPI ,9 月之前让所有的应用拥抱云原生。
迁移融合,与时间赛跑
20亿美元收购网易考拉,在阿里的收购历史上,既不是最大,也不是最难的。但半年完成整合、未满一年提出战略升级,在阿里的历史上从未有过。
快速的整合升级首先是由技术驱动的。
这一年多我们都在跟时间赛跑。
在迁移过程中,必须保证业务不受损、全部线上服务全程可用。但现实是,原机房距离太远,导致每一次的网络传输大概有 50 毫秒的延时,给不停服迁移带来了巨大的困难。
当时想到了一个比较完美的解决方案,在机房间挖了一条光纤,并建立了考拉独立的VPC,进行数据同步。既让网络流畅互通,又保证了数据安全。但是困难又来了。如果慢慢切换,流量先放 1% 、再放 5% 、再放 10% ,对于用户体验来说,损伤很大。试想,如果客户下一个单需要3秒钟,客服电话就要被打爆了。
疫情期间,考拉海购团队紧急进行内测。把各个环节、所有的测试链路分批全部进行了测试,保证了整个链路的完整性。那个夜晚真的是提心吊胆。必须保证没有灰度,才能做切换。
最终,考拉海购全量完成了迁移,性能没有出现任何问题。整个迁移过程比较稳定顺滑,到了阿里云,云网络这块也放心多了。
考拉海购 100% 全站迁移至阿里云后,稳定支撑了今年 3.8 女神节大促。这是考拉迁移上云后的首个大促,当天流量峰值较 2019 年双 12 增长了 72% ,但相比之前成本大幅度降低。考拉海购各业务线也在当天被证明 100% 打通,形成闭环。
整个迁移过程中,阿里云提供了很大的帮助。阿里云 EPC 安全方案、数据迁移方案非常成熟。此外,阿里云整体的能力支撑也很完整,迁移数据库、 ES 的成本很低,没有出现不兼容的情况。
阿里云提供了一个很强的功能,叫有状态的容器。以前的迁移是容器迁过来,IP地址就丢掉了。有了有状态的容器,可以保持 IP 地址不变。此外,阿里云产品提供了便捷的界面,可自助操作。这些产品优势对效率提升和成本节约的价值极其巨大。
下一步,全面拥抱云原生
完成了第一阶段的目标之后,考拉海购开始了全面的云原生之路。
云原生帮助考拉海购在运维效率上有了大幅提升。云原生产品提供了众多 API ,可以基于产品的运维接口进行组合,开发出系统,整体运维变得非常灵活。
在弹性上,考拉海购主要关注两方面,一是大促前后的弹性,二是白天高峰期和晚上低峰期的弹性。第一点比较常见,第二点借助于阿里云的弹性能力,也可以实现单日内的弹性收缩,对日常成本的节约非常有效。
在容灾方便,阿里云原生产品天然多 AZ 容灾能力,极大地加速了考拉海购同城多活能力的建设,因此考拉海购才能在短时间内很快扩展到多机房,并具备多AZ的容灾能力。
其次,基于 ARMS 和 PTS ,在业务不改造的情况下(个别特殊逻辑除外),就能完成全链路压测能力的接入,增量业务也可以零成本接入全链路压测,解决了业务监测和问题排查层面的诸多难题。
这就是阿里云天然的优势,因为这些云产品经过了历年双十一的检测,所要面临的问题场景和复杂度也是业界最难的,能经得住这些场景的考验,才历练了阿里云产品的能力。
用一年多时间重新出发,考拉海购如今走出了一条创新路径,成为国内首屈一指的会员电商平台。来自考拉海购官方的数据显示,截至 2020 年 6 月 30 日,考拉海购会员规模同比增长 23% 。会员凸显出高客单、高活跃、高复购的特点:会员年客单价是非会员的 7.3 倍,月度活跃是非会员的 2.4 倍,年订单数是非会员的 4 倍。