分布式系统架构2:服务发现

本文涉及的产品
网络型负载均衡 NLB,每月750个小时 15LCU
传统型负载均衡 CLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
简介: 服务发现是分布式系统中服务实例动态注册和发现机制,确保服务间通信。主要由注册中心和服务消费者组成,支持客户端和服务端两种发现模式。注册中心需具备高可用性,常用框架有Eureka、Zookeeper、Consul等。服务注册方式包括主动注册和被动注册,核心流程涵盖服务注册、心跳检测、服务发现、服务调用和注销。

1.概念

服务发现指的是分布式系统中,服务实例动态注册自己的信息到注册中心,其他服务能发现这些实例的位置,实现服务间通信。

为什么需要服务发现?

对于分布式应用来说,服务发现不是可选项,而是必须的。主要目的是让服务实例能相互识别和通信,确保系统在动态扩容、缩容和故障恢复时仍能正常运行。

2.组成

由注册中心和消费者组成

  • 注册中心Service Registry:服务实例将自己的元数据(IP、端口、健康状态等)注册到注册中心。维护一个服务注册表,记录所有可用服务的信息
  • 消费者Consumer:从注册中心获取目标服务的位置信息(服务实例列表),通过负载均衡选择一个实例进行通信。

3.两种发现模式

3.1客户端发现模式

概念:客户端负责确定可用服务的网络位置和请求负责均衡。

过程:客户端查询注册中心获取实例列表,接着客户端用负载均衡算法选择一个可用服务实例发出请求。如图:

服务发现1.png

Netflix OSS 提供了一个很好的客户端发现模式示例。Netflix Eureka 是一个服务注册中心,它提供了一组用于管理服务实例注册和查询可用实例的 REST API。Netflix Ribbon 是一个 IPC 客户端,可与 Eureka 一起使用,用于在可用服务实例之间使请求负载均衡。

优点:轻量级

缺点:需要客户端实现服务发现逻辑,代码复杂了。

3.2服务端发现模式

过程:客户端通过负载均衡器(如:Nginx或API Gateway)向服务发出请求,负载均衡器查询注册中心获取实例信息,然后将请求转发给合适的服务实例

服务发现2.png

案例:AWS Elastic Load Balancer(ELB)是一个服务端发现路由示例

优点:客户端不再关心服务发现的细节,只需要将请求发给负载均衡器

缺点:需要部署负载均衡器,保障高可用

4.注册中心

注册中心的作用是一个包含了服务实例网络位置的数据库。本身需要具备高可用性,通常通过分布式一致性协议(如Raft、Paxos)来保证数据的一致性和可靠性。

比如:Netflix Eureka,它提供了一个用于注册和查询服务实例的 REST API。

服务实例使用 POST 请求注册其网络位置。每隔 30 秒使用 PUT 请求刷新其注册信息。通过使用 HTTP DELETE 请求或实例注册超时来移除注册信息。

客户端可以使用 HTTP GET 请求来检索已注册的服务实例。

其他的注册中心:etcd,Consul,Zookeeper这些,我在后面的文章中学习后再写出来

5.服务注册的方式

5.1 主动注册Self-Registration

过程:服务实例启动后,主动将自己的信息注册到服务注册中心。并通过发送心跳请求来防止注册信息过期。

适用场景:微服务架构中,服务实例与注册中心直接交互

服务发现3.png

示例:

  • Eureka
    • Spring Cloud中,服务通过 @EnableEurekaClient 注解实现主动注册。
    • 服务启动时向Eureka Server注册自身的元数据信息(IP、端口、健康状态等)。

优点:实现简单,由服务自己掌握注册逻辑;

缺点:服务代码耦合了注册中心逻辑,增加服务端复杂度,且注册中心故障可能影响服务启动。

5.2被动注册(Third-Party Registration)

又叫第三方注册,原理:服务实例本身不负责注册操作,而是通过外部代理或监控组件检测到服务的状态,当检测到新的可用服务实例时,然后将其注册到服务注册中心。

服务发现4.png

示例:

Kubernetes

  • 使用kubelet定期监测Pod的状态,并将Pod的网络信息注册到Kubernetes的Service中。

优点:服务实例与注册逻辑解耦,服务代码无侵入。适用于现有服务

缺点:依赖第三方组件,注册的实时性较低于主动注册

6. 总结服务发现的核心流程

  • 服务注册:服务启动时向注册中心注册自身的元数据。
  • 心跳检测:服务持续发送健康状态给注册中心,确保可用性。
  • 服务发现:消费者从注册中心获取服务实例信息。
  • 服务调用:消费者选择合适的实例进行调用(客户端负载均衡或服务端负载均衡)。
  • 服务注销:服务关闭时从注册中心注销自己的信息。

7.框架对比

面试过程中可能还会文档服务发现框架的区别,以及选型依据,可以提前准备一些框架的内容,这里简单列一下:

服务注册与发现框架 语言支持 一致性 健康检查 配置复杂性 性能 数据持久化 功能丰富度
Eureka Java 支持 简单 不支持 中等
Zookeeper 多语言 不支持 复杂 支持 中等
Consul 多语言 支持 简单 支持
Etcd 多语言 支持 复杂 支持 中等
Nacos 多语言 支持 简单 支持
DNS(K8S) 多语言 支持 中等
相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
相关文章
|
5月前
|
人工智能 Kubernetes 数据可视化
Kubernetes下的分布式采集系统设计与实战:趋势监测失效引发的架构进化
本文回顾了一次关键词监测任务在容器集群中失效的全过程,分析了中转IP复用、调度节奏和异常处理等隐性风险,并提出通过解耦架构、动态IP分发和行为模拟优化采集策略,最终实现稳定高效的数据抓取与分析。
Kubernetes下的分布式采集系统设计与实战:趋势监测失效引发的架构进化
|
2月前
|
缓存 Cloud Native 中间件
《聊聊分布式》从单体到分布式:电商系统架构演进之路
本文系统阐述了电商平台从单体到分布式架构的演进历程,剖析了单体架构的局限性与分布式架构的优势,结合淘宝、京东等真实案例,深入探讨了服务拆分、数据库分片、中间件体系等关键技术实践,并总结了渐进式迁移策略与核心经验,为大型应用架构升级提供了全面参考。
|
2月前
|
存储 NoSQL 前端开发
【赵渝强老师】MongoDB的分布式存储架构
MongoDB分片通过将数据分布到多台服务器,实现海量数据的高效存储与读写。其架构包含路由、配置服务器和分片服务器,支持水平扩展,结合复制集保障高可用性,适用于大规模生产环境。
276 1
|
6月前
|
监控 算法 关系型数据库
分布式事务难题终结:Seata+DRDS全局事务一致性架构设计
在分布式系统中,CAP定理限制了可用性、一致性与分区容错的三者兼得,尤其在网络分区时需做出取舍。为应对这一挑战,最终一致性方案成为常见选择。以电商订单系统为例,微服务化后,原本的本地事务演变为跨数据库的分布式事务,暴露出全局锁失效、事务边界模糊及协议差异等问题。本文深入探讨了基于 Seata 与 DRDS 的分布式事务解决方案,涵盖 AT 模式实践、分片策略优化、典型问题处理、性能调优及高级特性实现,结合实际业务场景提供可落地的技术路径与架构设计原则。通过压测验证,该方案在事务延迟、TPS 及失败率等方面均取得显著优化效果。
335 61
|
7月前
|
监控 Linux 应用服务中间件
Linux多节点多硬盘部署MinIO:分布式MinIO集群部署指南搭建高可用架构实践
通过以上步骤,已成功基于已有的 MinIO 服务,扩展为一个 MinIO 集群。该集群具有高可用性和容错性,适合生产环境使用。如果有任何问题,请检查日志或参考MinIO 官方文档。作者联系方式vx:2743642415。
2229 57
|
11月前
|
存储 缓存 NoSQL
分布式系统架构8:分布式缓存
本文介绍了分布式缓存的理论知识及Redis集群的应用,探讨了AP与CP的区别,Redis作为AP系统具备高性能和高可用性但不保证强一致性。文章还讲解了透明多级缓存(TMC)的概念及其优缺点,并详细分析了memcached和Redis的分布式实现方案。此外,针对缓存穿透、击穿、雪崩和污染等常见问题提供了应对策略,强调了Cache Aside模式在解决数据一致性方面的作用。最后指出,面试中关于缓存的问题多围绕Redis展开,建议深入学习相关知识点。
718 8
|
7月前
|
消息中间件 缓存 算法
分布式开发:数字时代的高性能架构革命-为什么要用分布式?优雅草卓伊凡
分布式开发:数字时代的高性能架构革命-为什么要用分布式?优雅草卓伊凡
337 0
分布式开发:数字时代的高性能架构革命-为什么要用分布式?优雅草卓伊凡
|
9月前
|
并行计算 PyTorch 算法框架/工具
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。
727 3
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
|
9月前
|
人工智能 运维 监控
领先AI企业经验谈:探究AI分布式推理网络架构实践
当前,AI行业正处于快速发展的关键时期。继DeepSeek大放异彩之后,又一款备受瞩目的AI智能体产品Manus横空出世。Manus具备独立思考、规划和执行复杂任务的能力,其多智能体架构能够自主调用工具。在GAIA基准测试中,Manus的性能超越了OpenAI同层次的大模型,展现出卓越的技术实力。
|
11月前
|
存储 Prometheus Cloud Native
分布式系统架构6:链路追踪
本文深入探讨了分布式系统中的链路追踪理论,涵盖追踪与跨度的概念、追踪系统的模块划分及数据收集的三种方式。链路追踪旨在解决复杂分布式系统中请求流转路径不清晰的问题,帮助快速定位故障和性能瓶颈。文中介绍了基于日志、服务探针和边车代理的数据收集方法,并简述了OpenTracing、OpenCensus和OpenTelemetry等链路追踪协议的发展历程及其特点。通过理解这些概念,可以更好地掌握开源链路追踪框架的使用。
1112 41

热门文章

最新文章