客户背景
完美日记成立于2016年,是广州逸仙电子商务有限公司旗下品牌。品牌致力于探索欧美时尚趋势,同时结合亚洲女性面部和肌肤特点,研发一系列“高品质、精设计”的欧美时尚彩妆产品。
客户痛点
自行维护服务器成本过高:早期互联网公司通常直接购买服务器,并在 IDC 机房租用机架进行部署,将应用程序直接运行在物理机上。如果需要扩展,就必须购买新的服务器。IDC 机房会频繁出现各种故障,如果发生 IDC 迁移,就更加麻烦,必须在半夜搬机器,在成本、服务稳定性和工作效率等方面都会造成巨大的消耗。
人工发版繁琐易错:2019 年双 11 大促前夕,小程序刚刚上线。当时采用传统的部署方式,特别是某些应用需要在 SLB 上配置(openrestry),运维人员需要在 SLB 上一个个勾选服务器,发布版本的时间长达半个小时以上。如果发版中出现问题,通常还需要延长一个小时以上的时间来处理。
大规模应用的研发与运维挑战:对于大规模应用的研发和运维人员来说,是否拥有足够的技术和能力来应对挑战,产品架构设计是否可以满足未来的企业需求,组织架构和文化是否已经适应企业的新战略发展。
方案亮点
全栈容器化简化服务器运维: 从2019年开始,完美日记就开始筹备容器化改造,包括改造方案的设计和阿里云 Kubernetes 的选择。经过仔细的测试和结合公司情况和人员配备情况,最终选择了阿里云 ACK 托管版进行大规模应用部署,一次性将所有应用迁移到 ACK 容器服务,并以标准的 Kubernetes 方式进行运维部署。
全链路可观测和流量防护提升业务稳定性: 完美日记将 IT 系统接入全链路可观测产品 ARMS,跟踪复杂的服务调用,并对异常服务进行快速定位和修复。ARMS Prometheus 对 ACK 容器资源进行统一监控。同时,使用性能测试服务 PTS 进行压力测试,利用秒级流量和真实地理位置流量等特性进行测试。通过收集压测数据并分析系统的强依赖和关键瓶颈点,对关键业务接口、关键第三方调用、数据库慢调用等进行限流保护。
简单稳定且低成本的容器镜像仓库服务: 完美日记选用阿里云镜像企业版 ACR EE,因为它比自建 Harbor 更稳定、成本更低。自建 Harbor 需要考虑计算、数据库和磁盘成本,如果项目很多或镜像比较多,磁盘成本也会很高。而镜像企业版无需考虑维护成本。此外,镜像企业版可以高并发,而自建 Harbor 则容易出现镜像 PULL 问题。
容器弹性灵活应对流量洪峰: 利用 ACK 的快速弹性能力应对大促资源快速扩容,并结合在大促前进行 RDS/安全等产品扩容、链路梳理、缓存/连接池预热、后端资源保障等,以确保大促活动的平稳进行。
建设成果
云原生极大提升运维效率,降低人力成本:容器化改造之后,整个系统变得更加“轻松”。在切换到 Kubernetes 正式环境后,扩容时间只需要约90秒。根据运营节奏进行扩容,服务器扩容成本降低了70%~90%。同时,部署效率大幅提升,只需要按照文件模板创建一个服务,部署时间就能减少90%。
提升资源利用率,降低资源和管理成本:服务器资源可以自动计算并部署到服务器上,利用隔离技术可以部署多个项目服务器,提高50%利用率。服务模块的自动负载均衡无需人工干预,工作量减少90%。服务模块的伸缩容无需编写脚本,只需点击伸缩按钮,就可以减少人工错误率,工作量降低70%。服务模块不可用时会自动剔除并自动重启服务模块。服务器宕机时,运行在服务器上的服务模块会自动转移到可用服务器上,无需人工干预,工作量降低100%。
相关产品
阿里云容器服务ACK(Alibaba Cloud Container Service for Kubernetes)
阿里云容器镜像服务ACR(Alibaba Cloud Container Registry
阿里云监控服务 Prometheus(Aliyun Cloud Monitor Prometheus)
阿里云实时监控服务(ARMS)
阿里云性能测试PTS(Performance Testing Service)
阿里云微服务引擎 MSE(Alibaba Cloud Microservice Engine,MSE)
应用高可用服务 AHAS(Application High Availability Service)