《2023云原生实战案例集》——04 互联网——站酷 基于ASM解决多语言技术栈下服务管理难题,实现运维提效

本文涉及的产品
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
函数计算FC,每月15万CU 3个月
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 《2023云原生实战案例集》——04 互联网——站酷 基于ASM解决多语言技术栈下服务管理难题,实现运维提效

image.png 

客户简介

站酷(ZCOOL)深耕设计领域多年,聚集了 1500万设计师、摄影师、插画师、艺术家、 创意人,在设计创意群体中具有一定的影响力与号召力。业务使用了 Node.js. Java. PHP等多种技术栈进行开发,开发、运维协作成本高。

客户痛点

多语言、多集群服务统一纳管难:站酷面向互联网用户,提供站酷网、站酷海洛、站 酷学习等各项服务,这些业务使用了 Node.js. Java. PHP等多种技术栈进行开发, 并部署在多个Kubernetes集群中,如何通过统一的业务中台统一纳管这些业务是一 个很大的技术挑战。

•  可观测体系构建难:对于上述的业务架构而言,很难对于不同的应用服务实现统一的 可观测体系、进行服务指标的统一实时监控。

•  服务治理自动化集成难:由于站酷建设了统一的业务中台,对于服务的部署、维护、 治理等有着较强的自动化配置需求,对于多集群服务治理的场景需要一定的自动化集 成能力。

方案亮点

•  高效管理多集群、多语言下的应用服务管理:通过使用服务网格ASM,对多集群、多 形态、多语言服务的统一纳管成为了非常简单的工作。托管式服务网格ASM在成为多 种异构类型计算服务统一管理的基础设施中,提供了统一的流量管理能力、统一的服 务安全能力、统一的服务可观测性能力、以及实现统一的代理可扩展能力,以此构筑 企业级能力。

•  南北向与东西向流量统一治理:在社区Istio的网关基础上,ASM企业版提供了更多 的企业级高级特性,包括指标伸缩HPA)、基于InteLMuLtiBuffer技术的软硬结合性 能优化、网关无损升级、SLB优雅下线等,使网关真正达到了生产可用级别,可以很 好地支持各种企业级服务。

•  ASM可观测中心实现全业务的实时监控:在生产环境中,站酷主要利用了日志中心进 行了网格可观测性的建设。ASM通过与日志服务集成提供网关与网格内Sidecar日志 的自动采集,同时针对网关与网格内Sidecar访问日志分别提供了日志仪表盘,提供 包括请求错误率、P95延迟等实用指标监控,实现了对多集群异构应用的统一可观测 性。

•  插件市场完善:服务网格ASM在插件拓展中心中提供了即插即用的插件市场。针对各 种实际业务场景,提供了多种即插即用式插件,经过简单几个参数的配置即可快速启 用数据面Sidecar的各种拓展能力。通过对ASM插件市场的利用,站酷在很短时间内 就解决了业务迁移中遇到的问题。

•  支持自动化API集成:作为阿里云云产品,服务网格ASM除了通用的。penAPI/SDK 集成方式之外,也提供了其它多样化的产品功能模块集成方式,包括Kube APITerraform等,产品所提供的各大功能模块不仅能够通过ASM控制台进行访问,也能 以API的形式集成进厂商的自有业务中台之中,助力网格运维自动化。

建设成果

客户通过ASM高效解决了多语言技术栈情况下多集群的应用服务管理难题,运维效率提 升40% ;并借助ASM统一流量治理、全业务的实时观测能力,大幅提升了线上业务稳定 性。

相关产品

务网格ASM

器服务ACK

用实时监控服务ARMS

相关文章
|
3月前
|
边缘计算 运维 Kubernetes
云原生时代的运维转型之路
【8月更文挑战第29天】 在数字化转型的浪潮中,企业IT部门正面临前所未有的挑战。本文将探讨如何通过拥抱云原生技术,实现运维工作的现代化,提升系统稳定性和效率,同时降低运营成本。我们将分享实际案例,揭示成功转型的关键因素,并展望未来运维的发展趋势。
60 3
|
1月前
|
运维 应用服务中间件 持续交付
自动化运维的利器:Ansible实战应用
【9月更文挑战第33天】本文将带你深入理解Ansible,一个强大的自动化运维工具。我们将从基础概念开始,逐步探索其配置管理、任务调度等功能,并通过实际案例演示其在自动化部署和批量操作中的应用。文章旨在通过浅显易懂的语言和实例,为读者揭开Ansible的神秘面纱,展示其在简化运维工作中的强大能力。
145 64
|
3天前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
38 3
|
2月前
|
运维 安全 应用服务中间件
自动化运维的利剑:Ansible实战应用
【9月更文挑战第24天】在现代IT基础设施的快速迭代与扩展中,自动化运维成为提升效率、保障稳定性的关键。本文将深入探讨Ansible这一流行的自动化工具,通过实际案例分析其如何简化日常运维任务,优化工作流程,并提高系统的可靠性和安全性。我们将从Ansible的基础概念入手,逐步深入到高级应用技巧,旨在为读者提供一套完整的Ansible应用解决方案。
|
11天前
|
运维 监控 jenkins
运维自动化实战:利用Jenkins构建高效CI/CD流程
【10月更文挑战第18天】运维自动化实战:利用Jenkins构建高效CI/CD流程
|
20天前
|
运维 关系型数据库 MySQL
自动化运维工具Ansible的实战应用
【10月更文挑战第9天】在现代IT运维领域,效率和可靠性是衡量一个系统是否健康的重要指标。自动化运维工具Ansible因其简洁、易用的特性,成为了众多企业和开发者的首选。本文将通过实际案例,展示如何利用Ansible进行日常的运维任务,包括配置管理、软件部署以及批量操作等,帮助读者深入理解Ansible的应用场景及其带来的效益。
|
2天前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第27天】在智能运维中,Prometheus和Grafana的组合已成为监控和告警体系的事实标准。Prometheus负责数据收集和存储,支持灵活的查询语言PromQL;Grafana提供数据的可视化展示和告警功能。本文介绍如何配置Prometheus监控目标、Grafana数据源及告警规则,帮助运维团队实时监控系统状态,确保稳定性和可靠性。
18 0
|
2月前
|
运维 Cloud Native Docker
云原生技术入门:Docker容器化实战
【9月更文挑战第20天】本文将引导你走进云原生技术的世界,通过Docker容器化技术的实战演练,深入理解其背后的原理和应用。我们将一起探索如何在云平台上利用Docker简化部署、扩展和管理应用程序的过程,并揭示这一技术如何改变现代软件的开发和运维模式。
|
2月前
|
运维 监控 Cloud Native
云原生时代的运维策略:从反应式到自动化
在云计算的浪潮下,运维领域经历了翻天覆地的变化。本文将带你领略云原生时代下的运维新风貌,探索如何通过自动化和智能化手段,实现从传统的反应式运维向主动、智能的运维模式转变。我们将一起见证,这一变革如何助力企业提升效率,保障服务的连续性与安全性,以及运维人员如何适应这一角色的转变,成为云原生时代的引领者。
45 8
|
2月前
|
弹性计算 运维 Cloud Native
云原生时代的运维转型之路
在云计算飞速发展的今天,传统的运维模式已难以满足现代企业的需求。本文旨在探讨如何在云原生时代下进行有效的运维转型,从传统运维到云运维的转变不仅仅是技术的升级,更是思维和方法论的革新。通过实际案例分析,我们将深入了解这一转型过程中可能遇到的挑战与解决策略,以及如何利用云原生技术提高运维效率,保障系统稳定性和安全性,从而为企业带来持续的业务创新和价值增长。
43 6

相关产品

  • 服务网格