《2023云原生实战案例集》——04 互联网——站酷 基于ASM解决多语言技术栈下服务管理难题,实现运维提效

本文涉及的产品
应用实时监控服务-用户体验监控,每月100OCU免费额度
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 《2023云原生实战案例集》——04 互联网——站酷 基于ASM解决多语言技术栈下服务管理难题,实现运维提效

image.png 

客户简介

站酷(ZCOOL)深耕设计领域多年,聚集了 1500万设计师、摄影师、插画师、艺术家、 创意人,在设计创意群体中具有一定的影响力与号召力。业务使用了 Node.js. Java. PHP等多种技术栈进行开发,开发、运维协作成本高。

客户痛点

多语言、多集群服务统一纳管难:站酷面向互联网用户,提供站酷网、站酷海洛、站 酷学习等各项服务,这些业务使用了 Node.js. Java. PHP等多种技术栈进行开发, 并部署在多个Kubernetes集群中,如何通过统一的业务中台统一纳管这些业务是一 个很大的技术挑战。

•  可观测体系构建难:对于上述的业务架构而言,很难对于不同的应用服务实现统一的 可观测体系、进行服务指标的统一实时监控。

•  服务治理自动化集成难:由于站酷建设了统一的业务中台,对于服务的部署、维护、 治理等有着较强的自动化配置需求,对于多集群服务治理的场景需要一定的自动化集 成能力。

方案亮点

•  高效管理多集群、多语言下的应用服务管理:通过使用服务网格ASM,对多集群、多 形态、多语言服务的统一纳管成为了非常简单的工作。托管式服务网格ASM在成为多 种异构类型计算服务统一管理的基础设施中,提供了统一的流量管理能力、统一的服 务安全能力、统一的服务可观测性能力、以及实现统一的代理可扩展能力,以此构筑 企业级能力。

•  南北向与东西向流量统一治理:在社区Istio的网关基础上,ASM企业版提供了更多 的企业级高级特性,包括指标伸缩HPA)、基于InteLMuLtiBuffer技术的软硬结合性 能优化、网关无损升级、SLB优雅下线等,使网关真正达到了生产可用级别,可以很 好地支持各种企业级服务。

•  ASM可观测中心实现全业务的实时监控:在生产环境中,站酷主要利用了日志中心进 行了网格可观测性的建设。ASM通过与日志服务集成提供网关与网格内Sidecar日志 的自动采集,同时针对网关与网格内Sidecar访问日志分别提供了日志仪表盘,提供 包括请求错误率、P95延迟等实用指标监控,实现了对多集群异构应用的统一可观测 性。

•  插件市场完善:服务网格ASM在插件拓展中心中提供了即插即用的插件市场。针对各 种实际业务场景,提供了多种即插即用式插件,经过简单几个参数的配置即可快速启 用数据面Sidecar的各种拓展能力。通过对ASM插件市场的利用,站酷在很短时间内 就解决了业务迁移中遇到的问题。

•  支持自动化API集成:作为阿里云云产品,服务网格ASM除了通用的。penAPI/SDK 集成方式之外,也提供了其它多样化的产品功能模块集成方式,包括Kube APITerraform等,产品所提供的各大功能模块不仅能够通过ASM控制台进行访问,也能 以API的形式集成进厂商的自有业务中台之中,助力网格运维自动化。

建设成果

客户通过ASM高效解决了多语言技术栈情况下多集群的应用服务管理难题,运维效率提 升40% ;并借助ASM统一流量治理、全业务的实时观测能力,大幅提升了线上业务稳定 性。

相关产品

务网格ASM

器服务ACK

用实时监控服务ARMS

相关文章
|
5天前
|
运维 监控 Cloud Native
云原生之运维监控实践:使用 taosKeeper 与 TDinsight 实现对 时序数据库TDengine 服务的监测告警
在数字化转型的过程中,监控与告警功能的优化对保障系统的稳定运行至关重要。本篇文章是“2024,我想和 TDengine 谈谈”征文活动的三等奖作品之一,详细介绍了如何利用 TDengine、taosKeeper 和 TDinsight 实现对 TDengine 服务的状态监控与告警功能。作者通过容器化安装 TDengine 和 Grafana,演示了如何配置 Grafana 数据源、导入 TDinsight 仪表板、以及如何设置告警规则和通知策略。欢迎大家阅读。
22 0
|
2月前
|
Kubernetes Cloud Native Docker
云原生之旅:从传统架构到容器化服务的演变
随着技术的快速发展,云计算已经从简单的虚拟化服务演进到了更加灵活和高效的云原生时代。本文将带你了解云原生的概念、优势以及如何通过容器化技术实现应用的快速部署和扩展。我们将以一个简单的Python Web应用为例,展示如何利用Docker容器进行打包和部署,进而探索Kubernetes如何管理这些容器,确保服务的高可用性和弹性伸缩。
|
2月前
|
运维 Cloud Native 云计算
云原生之旅:Docker容器化实战
本文将带你走进云原生的世界,深入理解Docker技术如何改变应用部署与运维。我们将通过实际案例,展示如何利用Docker简化开发流程,提升应用的可移植性和伸缩性。文章不仅介绍基础概念,还提供操作指南和最佳实践,帮助你快速上手Docker,开启云原生的第一步。
|
2月前
|
机器学习/深度学习 人工智能 运维
智能化运维:提升IT服务效率的新引擎###
本文深入浅出地探讨了智能化运维(AIOps)如何革新传统IT运维模式,通过大数据、机器学习与自动化技术,实现故障预警、快速定位与处理,从而显著提升IT服务的稳定性和效率。不同于传统运维依赖人工响应,AIOps强调预测性维护与自动化流程,为企业数字化转型提供强有力的支撑。 ###
|
5月前
|
运维 Cloud Native Devops
一线实战:运维人少,我们从 0 到 1 实践 DevOps 和云原生
上海经证科技有限公司为有效推进软件项目管理和开发工作,选择了阿里云云效作为 DevOps 解决方案。通过云效,实现了从 0 开始,到现在近百个微服务、数百条流水线与应用交付的全面覆盖,有效支撑了敏捷开发流程。
19384 30
|
3月前
|
存储 Oracle 关系型数据库
数据库数据恢复—Oracle ASM磁盘组故障数据恢复案例
Oracle数据库数据恢复环境&故障: Oracle ASM磁盘组由4块磁盘组成。Oracle ASM磁盘组掉线 ,ASM实例不能mount。 Oracle数据库故障分析&恢复方案: 数据库数据恢复工程师对组成ASM磁盘组的磁盘进行分析。对ASM元数据进行分析发现ASM存储元数据损坏,导致磁盘组无法挂载。
|
4月前
|
运维 Cloud Native Docker
云原生技术入门:Docker容器化实战
【9月更文挑战第20天】本文将引导你走进云原生技术的世界,通过Docker容器化技术的实战演练,深入理解其背后的原理和应用。我们将一起探索如何在云平台上利用Docker简化部署、扩展和管理应用程序的过程,并揭示这一技术如何改变现代软件的开发和运维模式。
|
5月前
|
机器学习/深度学习 存储 人工智能
智能化运维:构建未来IT服务的蓝图
在数字化浪潮的推动下,运维领域正经历一场革命性的变革。本文将探讨如何通过引入人工智能、机器学习等技术,实现运维工作的智能化,从而提高服务质量和效率。我们将一起探索智能运维的核心要素,包括自动化、实时监控、预测性维护和持续改进策略,并讨论这些技术如何塑造未来的IT服务。
|
5月前
|
Kubernetes Cloud Native Docker
云原生入门:Docker容器化部署实战
【8月更文挑战第31天】在数字化浪潮中,云原生技术成为企业转型的助推器。本文通过Docker容器化部署的实践案例,引导读者从零基础到掌握基础的云原生应用部署技能。我们将一起探索Docker的魅力,学习如何将一个应用容器化,并在云平台上运行起来,为深入云原生世界打下坚实基础。
|
5月前
|
运维 Kubernetes Cloud Native
Kubernetes云原生问题之在托管Kubernetes服务中云服务商和用户的运维责任划分如何解决
Kubernetes云原生问题之在托管Kubernetes服务中云服务商和用户的运维责任划分如何解决
46 0

相关产品

  • 服务网格