ACP互联网架构认证笔记 EDAS企业级分布式应用服务

简介: 应用生命周期,大规模集群应用管理,应用beta、分批发布,弹性伸缩,流量引导与灰度发布

特点

服务化

  1. 应用容器,多款互联网中间件
  2. 高性能服务框架,服务鉴权
  3. 服务基础设施,任务调度服务,配置推送服务,分布式事务支持

应用生命周期

  1. 应用生命周期,大规模集群应用管理,应用beta、分批发布,弹性伸缩,流量引导与灰度发布
  2. 账号与权限,主子账号,自定义角色,资源组

数据化运营

  1. 分布式调用跟踪,应用监控,IAAS基础监控,容器层监控,业务监控大盘,定制化报表大盘

高可用管控

  1. 服务治理,容量自动化压测,容量规划,限流降级
  2. 智能应用诊断,实时日志,容器运行时诊断

资源管理介绍

服务化基础设施

  1. 分布式任务调度服务
  2. 实时配置推送服务
  3. 分布式事务处理

资源管理介绍

  1. 最高提供500个节点

2.管理ECS,SLB,VPC(网络管理)

应用监控

  1. 监控大盘、基础监控、服务监控
  2. 监控大盘:服务提供、服务消费、基础监控
  3. 基础监控:每台机器的,CPU数据汇总、内存数据汇总、负载汇总、磁盘读写速度汇总、磁盘读写次数数据汇总
  4. 服务监控:系统概要、HTTP入口、提供的RPC服务、RPC服务来源、RPC调用依赖、消息发送、消息接收、新数据库访问

应用管理

  1. 部署应用,回滚应用,应用扩容,删除应用

弹性伸缩

  1. 伸缩规则,历史记录
  2. 伸缩规则里面参数:CPU(使用率),RT(响应时间),Load(负载)

通知报警

  1. 报警规则,报警联系人,报警记录
  2. 联系人只能添加账号联系人

EDAS RPC 服务

EDAS RPC 服务提供对 Dubbo 框架的支持。一个使用 Dubbo 框架开发的,并以 WAR 为部署方式的应用,可以无缝在 EDAS 平台进行应用的发布和管理,并使用所有 EDAS 所提供的服务治理和数据化运营功能。

高性能服务框架

HSF 是一款面向企业级互联网架构的分布式服务框架,以高性能网络通信框架为基础,提供了诸如服务发布与注册、服务调用、服务路由、服务鉴权、服务限流、服务降级和服务调用链路跟踪等一系列功能特性。

IaaS 基础监控

EDAS 的监控功能之一,能够针对应用的运行状态,对机器的 CPU、内存、负载、网络和磁盘等基础指标进行详细的监控。

分布式链路跟踪

EDAS 鹰眼监控系统能够分析分布式系统的每一次系统调用、消息发送和数据库访问,从而精准发现系统的瓶颈和隐患。

服务调用监控

EDAS 的监控功能之一,能够针对应用的服务调用情况,对服务的 QPS、响应时间和出错率进行全方面的监控。

  • EDAS 中提供 HTTP 服务的 Web 应用,需要使用 SLB 来进行负载均衡,您可以在 EDAS 的应用配置页面,进行 SLB 的配置。具体配置步骤,请参考应用设置中的配置负载均衡。
  • 对于 EDAS 的 RPC 服务提供者对应的应用,您无需考虑负载均衡问题,EDAS 原生支持对 RPC 服务提供者的负载均衡。

应用监控可以准确的反映应用的实时流量情况和历史信息,您可以通过该信息监控应用的健康状态,并且可以快速发现、定位问题。

名词解释

  • TraceId: 与一次请求相对应,全局唯一,在各个系统间传递。
  • IP 地址:创建 TraceId 的机器的 IP(十六进制)。
  • 创建时间:调用链路创建的时间。
  • 顺序数:用于链路采样。
  • 标志位:可选,用于调试和标记。
  • 进程号:可选,单机多进程的应用使用。
  • RpcId: 调用标识日志埋点顺序和嵌套关系,也在各个系统间传递。
  • 服务维度: 服务监控的监控数据分为应用维度和服务维度,应用维度的数据按照应用聚合,而服务维度的数据按照您自定义的服务聚合,例如您有一个应用 A,它提供了几个服务 a,b,c。
  • 下钻应用: 查看目标指标关联的上(下)游应用的相关指标情况。

监控数据类型

在服务监控页面中提供了不同监控数据类型的页签,可以有针对性的进行监控,如:

  • 提供的 RPC 服务:应用作为服务端提供 RPC 服务的情况(包含 HSF 类型和其他自定义类型)。
  • RPC 调用来源:当前应用所提供的 RPC 服务被以下应用调用的情况。
  • RPC 调用依赖:当前应用调用其它应用提供的 RPC 服务的情况(包含 HSF 类型和其他自定义类型)。

监控报表类型

  • 图表混合(默认):以“表格+图”的形式展现数据,包含的信息有监控对象、时间、QPS、耗时、服务端耗时、错和结果,其中图中展现信息默认为一小时的数据,表格展现的数据默认为五分钟的数据;
  • 多图:以“图”的形式展现数据,包含的信息有监控对象、时间、QPS、耗时、错和结果,其中图中展现信息默认为一小时的数据,并会单独列出最近时刻的数据;
  • 表格:以“表格”的形式展现数据,包含的信息有监控对象、QPS、耗时、错和结果,其展示的信息为最近一分钟的数据;

指标说明

  • 错/s:记录一分钟内 RPC 调用的出错速率,计算方式为为错=该分钟内总错误数/60。
  • 结果/s:记录返回结果,形式以“结果:QPS”展示,其中“结果”表示的是 RPC 的结果,HTTP 的结果与 HTTP 协议的 ErrorCode 一致。

相关实践学习
微服务实战-服务注册中心 - Nacos
Nacos是阿里巴巴于2018年7月发布的一个开源项目,它是一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。Nacos 支持几乎所有主流类型的服务的发现、配置和管理: Kubernetes Service  gRPC & Dubbo RPC Service  Spring Cloud RESTful Service  
目录
相关文章
|
7月前
|
监控 Java API
Spring Boot 3.2 结合 Spring Cloud 微服务架构实操指南 现代分布式应用系统构建实战教程
Spring Boot 3.2 + Spring Cloud 2023.0 微服务架构实践摘要 本文基于Spring Boot 3.2.5和Spring Cloud 2023.0.1最新稳定版本,演示现代微服务架构的构建过程。主要内容包括: 技术栈选择:采用Spring Cloud Netflix Eureka 4.1.0作为服务注册中心,Resilience4j 2.1.0替代Hystrix实现熔断机制,配合OpenFeign和Gateway等组件。 核心实操步骤: 搭建Eureka注册中心服务 构建商品
1152 3
|
11月前
|
人工智能 安全 Java
智慧工地源码,Java语言开发,微服务架构,支持分布式和集群部署,多端覆盖
智慧工地是“互联网+建筑工地”的创新模式,基于物联网、移动互联网、BIM、大数据、人工智能等技术,实现对施工现场人员、设备、材料、安全等环节的智能化管理。其解决方案涵盖数据大屏、移动APP和PC管理端,采用高性能Java微服务架构,支持分布式与集群部署,结合Redis、消息队列等技术确保系统稳定高效。通过大数据驱动决策、物联网实时监测预警及AI智能视频监控,消除数据孤岛,提升项目可控性与安全性。智慧工地提供专家级远程管理服务,助力施工质量和安全管理升级,同时依托可扩展平台、多端应用和丰富设备接口,满足多样化需求,推动建筑行业数字化转型。
386 5
|
6月前
|
消息中间件 缓存 监控
中间件架构设计与实践:构建高性能分布式系统的核心基石
摘要 本文系统探讨了中间件技术及其在分布式系统中的核心价值。作者首先定义了中间件作为连接系统组件的"神经网络",强调其在数据传输、系统稳定性和扩展性中的关键作用。随后详细分类了中间件体系,包括通信中间件(如RabbitMQ/Kafka)、数据中间件(如Redis/MyCAT)等类型。文章重点剖析了消息中间件的实现机制,通过Spring Boot代码示例展示了消息生产者的完整实现,涵盖消息ID生成、持久化、批量发送及重试机制等关键技术点。最后,作者指出中间件架构设计对系统性能的决定性影响,
|
存储 缓存 NoSQL
分布式系统架构8:分布式缓存
本文介绍了分布式缓存的理论知识及Redis集群的应用,探讨了AP与CP的区别,Redis作为AP系统具备高性能和高可用性但不保证强一致性。文章还讲解了透明多级缓存(TMC)的概念及其优缺点,并详细分析了memcached和Redis的分布式实现方案。此外,针对缓存穿透、击穿、雪崩和污染等常见问题提供了应对策略,强调了Cache Aside模式在解决数据一致性方面的作用。最后指出,面试中关于缓存的问题多围绕Redis展开,建议深入学习相关知识点。
841 8
|
10月前
|
监控 Linux 应用服务中间件
Linux多节点多硬盘部署MinIO:分布式MinIO集群部署指南搭建高可用架构实践
通过以上步骤,已成功基于已有的 MinIO 服务,扩展为一个 MinIO 集群。该集群具有高可用性和容错性,适合生产环境使用。如果有任何问题,请检查日志或参考MinIO 官方文档。作者联系方式vx:2743642415。
3380 57
|
消息中间件 人工智能 监控
文生图架构设计原来如此简单之分布式服务
想象一下,当成千上万的用户同时要求AI画图,如何公平高效地处理这些请求?文生图/图生图大模型的架构设计看似复杂,实则遵循简单而有效的原则:合理排队、分工明确、防患未然。
455 14
文生图架构设计原来如此简单之分布式服务
|
10月前
|
消息中间件 缓存 算法
分布式开发:数字时代的高性能架构革命-为什么要用分布式?优雅草卓伊凡
分布式开发:数字时代的高性能架构革命-为什么要用分布式?优雅草卓伊凡
866 0
分布式开发:数字时代的高性能架构革命-为什么要用分布式?优雅草卓伊凡
|
12月前
|
并行计算 PyTorch 算法框架/工具
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。
1087 3
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
|
存储 Prometheus Cloud Native
分布式系统架构6:链路追踪
本文深入探讨了分布式系统中的链路追踪理论,涵盖追踪与跨度的概念、追踪系统的模块划分及数据收集的三种方式。链路追踪旨在解决复杂分布式系统中请求流转路径不清晰的问题,帮助快速定位故障和性能瓶颈。文中介绍了基于日志、服务探针和边车代理的数据收集方法,并简述了OpenTracing、OpenCensus和OpenTelemetry等链路追踪协议的发展历程及其特点。通过理解这些概念,可以更好地掌握开源链路追踪框架的使用。
1394 41
|
人工智能 运维 监控
领先AI企业经验谈:探究AI分布式推理网络架构实践
当前,AI行业正处于快速发展的关键时期。继DeepSeek大放异彩之后,又一款备受瞩目的AI智能体产品Manus横空出世。Manus具备独立思考、规划和执行复杂任务的能力,其多智能体架构能够自主调用工具。在GAIA基准测试中,Manus的性能超越了OpenAI同层次的大模型,展现出卓越的技术实力。