《云原生架构容器&微服务优秀案例集》——01 互联网——站酷 基于 ASM 解决多语言技术栈下服务管理难题,实现运维提效

简介: 《云原生架构容器&微服务优秀案例集》——01 互联网——站酷 基于 ASM 解决多语言技术栈下服务管理难题,实现运维提效

image.png

客户简介

站酷(ZCOOL)深耕设计领域多年,聚集了 1500 万设计师、摄影师、插画师、艺术家、创意人,在设计创意群体中具有一定的影响力与号召力。业务使用了 Node.js、Java、PHP 等多种技术栈进行开发,开发、运维协作成本高。


客户痛点


多语言、多集群服务统一纳管难 : 站酷面向互联网用户,提供站酷网、站酷海洛、站酷学习等各项服务。这些业务使用了多种技术栈,例如 Node.js、Java、PHP,部署在多个 Kubernetes 集群中。如何通过统一的业务中台来纳管这些业务是一个巨大的技术挑战。


可观测体系构建难 : 对于上述业务架构, 实现不同应用服务的统一可观测体系, 以及进行服务指标的统一实时监控,是一个难点。


服务治理自动化集成难 : 由于站酷建设了统一的业务中台,需要对服务的部署、维护、治理等方面实现较强的自动化配置需求。在多集群服务治理的场景下,自动化集成能力也是至关重要的。


方案亮点


高效管理多集群、多语言下的应用服务 : 通过使用服务网格 ASM,多集群、多形态、多语言服务的统一管理变得非常简单。 ASM 是一种托管式服务网格, 可用于多种异构类型计算服务的统一管理,提供了统一的流量管理、服务安全、服务可观测性和代理可扩展能力,构建出企业级能力。


南北向和东西向流量的统一治理 : 在社区版 Istio 的网关基础上, ASM 企业版提供了更多的企业级高级特性,包括指标伸缩 (HPA)、基于 Intel MultiBuffffer 技术的软硬结合性能优化、网关无损升级、SLB 优雅下线等。这些特性使得网关真正达到了生产可用级别,能够很好地支持各种企业级服务。


ASM 可观测中心实现全业务的实时监控 : 在生产环境中, 站酷主要利用了日志中心进行了网格可观测性的建设。ASM 通过与日志服务集成, 提供网关与网格内 Sidecar 日志的自动采集, 并针对网关与网格内 Sidecar 访问日志分别提供了日志仪表盘。这些仪表盘提供了实用指标监控,如请求错误率、P95 延迟等,实现了对多集群异构应用的统一可观测性。


插件市场完善 : 服务网格 ASM 在插件拓展中心中提供了即插即用的插件市场。该市场针对各种实际业务场景提供了多种即插即用的插件,通过简单配置参数即可快速启用数据面 Sidecar 的各种拓展能力。通过利用 ASM 插件市场,站酷在很短时间内就解决了业务迁移中遇到的问题。


支持自动化 API 集成 : 作为阿里云云产品, 服务网格 ASM 除了通用的 OpenAPI/SDK 集成方式之外, 还提供了其他多样化的产品功能模块集成方式, 包括 Kube API、 Terraform 等。ASM 提供的各大功能模块不仅能够通过 ASM 控制台进行访问, 还可以以 API 的形式集成到厂商的自有业务中台中,助力网格运维自动化。


建设成果

通过使用 ASM, 客户成功解决了多语言技术栈情况下的多集群应用服务管理难题, 同时提高运维效率 40%。ASM 还提供了统一流量治理和全业务的实时观测能力,大幅度提升了线上业务的稳定性。


相关产品

 服务网格 ASM

2 容器服务 ACK

3 应用实时监控服务 ARMS

目录
相关文章
|
5月前
|
人工智能 运维 自然语言处理
别再靠“救火”过日子了:智能运维,正在重塑IT服务的未来
别再靠“救火”过日子了:智能运维,正在重塑IT服务的未来
590 15
|
存储 Cloud Native 数据处理
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
本文整理自阿里云资深技术专家、Apache Flink PMC 成员梅源在 Flink Forward Asia 新加坡 2025上的分享,深入解析 Flink 状态管理系统的发展历程,从核心设计到 Flink 2.0 存算分离架构,并展望未来基于流批一体的通用增量计算方向。
464 0
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
|
6月前
|
机器学习/深度学习 人工智能 运维
云架构不是养祖宗,智能运维教你省心又省钱
云架构不是养祖宗,智能运维教你省心又省钱
167 2
|
7月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
本文内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
626 16
|
6月前
|
数据采集 运维 数据可视化
AR 运维系统与 MES、EMA、IoT 系统的融合架构与实践
AR运维系统融合IoT、EMA、MES数据,构建“感知-分析-决策-执行”闭环。通过AR终端实现设备数据可视化,实时呈现温度、工单等信息,提升运维效率与生产可靠性。(238字)
|
7月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
|
5月前
|
运维 Prometheus 监控
别再“亡羊补牢”了!——聊聊如何优化企业的IT运维监控架构
别再“亡羊补牢”了!——聊聊如何优化企业的IT运维监控架构
224 8
|
11月前
|
运维 Cloud Native 测试技术
极氪汽车云原生架构落地实践
随着极氪数字业务的飞速发展,背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验,并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。
|
5月前
|
人工智能 Kubernetes Cloud Native
Higress(云原生AI网关) 架构学习指南
Higress 架构学习指南 🚀写在前面: 嘿,欢迎你来到 Higress 的学习之旅!
1556 0
|
5月前
|
存储 运维 监控
57_大模型监控与运维:构建稳定可靠的服务体系
随着大语言模型(LLM)技术的快速发展和广泛应用,如何确保模型在生产环境中的稳定运行、高效服务和安全合规已成为企业和开发者面临的关键挑战。2025年,大模型服务已从实验室走向各行各业的核心业务流程,其运维复杂度也随之呈指数级增长。与传统软件系统不同,大模型服务具有参数规模庞大、计算密集、行为不确定性高等特点,这使得传统的运维监控体系难以满足需求。

相关产品

  • 服务网格