《2023云原生实战案例集》——04 互联网——站酷 基于ASM解决多语言技术栈下服务管理难题,实现运维提效

本文涉及的产品
MSE Nacos/ZooKeeper 企业版试用,1600元额度,限量50份
函数计算FC,每月15万CU 3个月
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 《2023云原生实战案例集》——04 互联网——站酷 基于ASM解决多语言技术栈下服务管理难题,实现运维提效

image.png 

客户简介

站酷(ZCOOL)深耕设计领域多年,聚集了 1500万设计师、摄影师、插画师、艺术家、 创意人,在设计创意群体中具有一定的影响力与号召力。业务使用了 Node.js. Java. PHP等多种技术栈进行开发,开发、运维协作成本高。

客户痛点

多语言、多集群服务统一纳管难:站酷面向互联网用户,提供站酷网、站酷海洛、站 酷学习等各项服务,这些业务使用了 Node.js. Java. PHP等多种技术栈进行开发, 并部署在多个Kubernetes集群中,如何通过统一的业务中台统一纳管这些业务是一 个很大的技术挑战。

•  可观测体系构建难:对于上述的业务架构而言,很难对于不同的应用服务实现统一的 可观测体系、进行服务指标的统一实时监控。

•  服务治理自动化集成难:由于站酷建设了统一的业务中台,对于服务的部署、维护、 治理等有着较强的自动化配置需求,对于多集群服务治理的场景需要一定的自动化集 成能力。

方案亮点

•  高效管理多集群、多语言下的应用服务管理:通过使用服务网格ASM,对多集群、多 形态、多语言服务的统一纳管成为了非常简单的工作。托管式服务网格ASM在成为多 种异构类型计算服务统一管理的基础设施中,提供了统一的流量管理能力、统一的服 务安全能力、统一的服务可观测性能力、以及实现统一的代理可扩展能力,以此构筑 企业级能力。

•  南北向与东西向流量统一治理:在社区Istio的网关基础上,ASM企业版提供了更多 的企业级高级特性,包括指标伸缩HPA)、基于InteLMuLtiBuffer技术的软硬结合性 能优化、网关无损升级、SLB优雅下线等,使网关真正达到了生产可用级别,可以很 好地支持各种企业级服务。

•  ASM可观测中心实现全业务的实时监控:在生产环境中,站酷主要利用了日志中心进 行了网格可观测性的建设。ASM通过与日志服务集成提供网关与网格内Sidecar日志 的自动采集,同时针对网关与网格内Sidecar访问日志分别提供了日志仪表盘,提供 包括请求错误率、P95延迟等实用指标监控,实现了对多集群异构应用的统一可观测 性。

•  插件市场完善:服务网格ASM在插件拓展中心中提供了即插即用的插件市场。针对各 种实际业务场景,提供了多种即插即用式插件,经过简单几个参数的配置即可快速启 用数据面Sidecar的各种拓展能力。通过对ASM插件市场的利用,站酷在很短时间内 就解决了业务迁移中遇到的问题。

•  支持自动化API集成:作为阿里云云产品,服务网格ASM除了通用的。penAPI/SDK 集成方式之外,也提供了其它多样化的产品功能模块集成方式,包括Kube APITerraform等,产品所提供的各大功能模块不仅能够通过ASM控制台进行访问,也能 以API的形式集成进厂商的自有业务中台之中,助力网格运维自动化。

建设成果

客户通过ASM高效解决了多语言技术栈情况下多集群的应用服务管理难题,运维效率提 升40% ;并借助ASM统一流量治理、全业务的实时观测能力,大幅提升了线上业务稳定 性。

相关产品

务网格ASM

器服务ACK

用实时监控服务ARMS

相关文章
|
3月前
|
人工智能 运维 监控
运维也能“先演练后实战”?聊聊数字孪生的那些神操作
运维也能“先演练后实战”?聊聊数字孪生的那些神操作
105 0
|
5月前
|
人工智能 运维 安全
基于合合信息开源智能终端工具—Chaterm的实战指南【当运维遇上AI,一场效率革命正在发生】
在云计算和多平台运维日益复杂的今天,传统命令行工具正面临前所未有的挑战。工程师不仅要记忆成百上千条操作命令,还需在不同平台之间切换终端、脚本、权限和语法,操作效率与安全性常常难以兼顾。尤其在多云环境、远程办公、跨部门协作频繁的背景下,这些“低效、碎片化、易出错”的传统运维方式,已经严重阻碍了 IT 团队的创新能力和响应速度。 而就在这时,一款由合合信息推出的新型智能终端工具——Chaterm,正在悄然颠覆这一现状。它不仅是一款跨平台终端工具,更是业内率先引入 AI Agent 能力 的“会思考”的云资源管理助手。
|
4月前
|
缓存 运维 安全
7天精通电商API:从接入到运维的完整实战手册
本文全面解析电商API接口技术,从基础概念到高阶应用,涵盖商品、订单、支付与营销等核心模块,并深入探讨性能优化、安全防护与智能化发展方向,助你掌握驱动数字商业的核心技术。
|
1月前
|
Cloud Native Serverless API
微服务架构实战指南:从单体应用到云原生的蜕变之路
🌟蒋星熠Jaxonic,代码为舟的星际旅人。深耕微服务架构,擅以DDD拆分服务、构建高可用通信与治理体系。分享从单体到云原生的实战经验,探索技术演进的无限可能。
微服务架构实战指南:从单体应用到云原生的蜕变之路
|
1月前
|
数据采集 运维 监控
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
本文系统解析爬虫与自动化核心技术,涵盖HTTP请求、数据解析、分布式架构及反爬策略,结合Scrapy、Selenium等框架实战,助力构建高效、稳定、合规的数据采集系统。
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
|
10月前
|
消息中间件 存储 Cloud Native
云消息队列 Kafka 版 V3 系列荣获信通院“云原生技术创新标杆案例”
2024 年 12 月 24 日,由中国信息通信研究院(以下简称“中国信通院”)主办的“2025 中国信通院深度观察报告会:算力互联网分论坛”,在北京隆重召开。本次论坛以“算力互联网 新质生产力”为主题,全面展示中国信通院在算力互联网产业领域的研究、实践与业界共识,与产业先行者共同探索算力互联网产业未来发展的方向。会议公布了“2024 年度云原生与应用现代化标杆案例”评选结果,“云消息队列 Kafka 版 V3 系列”荣获“云原生技术创新标杆案例”。
307 93
|
7月前
|
消息中间件 存储 NoSQL
RocketMQ实战—6.生产优化及运维方案
本文围绕RocketMQ集群的使用与优化,详细探讨了六个关键问题。首先,介绍了如何通过ACL配置实现RocketMQ集群的权限控制,防止不同团队间误用Topic。其次,讲解了消息轨迹功能的开启与追踪流程,帮助定位和排查问题。接着,分析了百万消息积压的处理方法,包括直接丢弃、扩容消费者或通过新Topic间接扩容等策略。此外,提出了针对RocketMQ集群崩溃的金融级高可用方案,确保消息不丢失。同时,讨论了为RocketMQ增加限流功能的重要性及实现方式,以提升系统稳定性。最后,分享了从Kafka迁移到RocketMQ的双写双读方案,确保数据一致性与平稳过渡。
|
3月前
使用 ASM 对集群外部服务进行熔断
熔断是一种流量管理策略,用于系统故障或超载时保护系统。ASM 支持集群内外服务的熔断配置,通过 sidecar 自动完成,无需修改应用。本文介绍如何部署应用并配置熔断规则,验证熔断效果。
105 0
|
9月前
|
运维 Kubernetes 网络协议
基于虚拟服务配置的渐进式迁移实践:Istio集群至ASM集群的平滑切换
本文介绍了从Istio+k8s环境迁移到阿里云ASM+ACK环境的渐进式方法,通过配置虚拟服务和入口服务实现新老集群间的服务调用与流量转发,确保业务连续性与平滑迁移
858 132

相关产品

  • 服务网格