分布式系统架构2:服务发现

本文涉及的产品
应用实时监控服务-用户体验监控,每月100OCU免费额度
函数计算FC,每月15万CU 3个月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
简介: 服务发现是分布式系统中服务实例动态注册和发现机制,确保服务间通信。主要由注册中心和服务消费者组成,支持客户端和服务端两种发现模式。注册中心需具备高可用性,常用框架有Eureka、Zookeeper、Consul等。服务注册方式包括主动注册和被动注册,核心流程涵盖服务注册、心跳检测、服务发现、服务调用和注销。

1.概念

服务发现指的是分布式系统中,服务实例动态注册自己的信息到注册中心,其他服务能发现这些实例的位置,实现服务间通信。

为什么需要服务发现?

对于分布式应用来说,服务发现不是可选项,而是必须的。主要目的是让服务实例能相互识别和通信,确保系统在动态扩容、缩容和故障恢复时仍能正常运行。

2.组成

由注册中心和消费者组成

  • 注册中心Service Registry:服务实例将自己的元数据(IP、端口、健康状态等)注册到注册中心。维护一个服务注册表,记录所有可用服务的信息
  • 消费者Consumer:从注册中心获取目标服务的位置信息(服务实例列表),通过负载均衡选择一个实例进行通信。

3.两种发现模式

3.1客户端发现模式

概念:客户端负责确定可用服务的网络位置和请求负责均衡。

过程:客户端查询注册中心获取实例列表,接着客户端用负载均衡算法选择一个可用服务实例发出请求。如图:

服务发现1.png

Netflix OSS 提供了一个很好的客户端发现模式示例。Netflix Eureka 是一个服务注册中心,它提供了一组用于管理服务实例注册和查询可用实例的 REST API。Netflix Ribbon 是一个 IPC 客户端,可与 Eureka 一起使用,用于在可用服务实例之间使请求负载均衡。

优点:轻量级

缺点:需要客户端实现服务发现逻辑,代码复杂了。

3.2服务端发现模式

过程:客户端通过负载均衡器(如:Nginx或API Gateway)向服务发出请求,负载均衡器查询注册中心获取实例信息,然后将请求转发给合适的服务实例

服务发现2.png

案例:AWS Elastic Load Balancer(ELB)是一个服务端发现路由示例

优点:客户端不再关心服务发现的细节,只需要将请求发给负载均衡器

缺点:需要部署负载均衡器,保障高可用

4.注册中心

注册中心的作用是一个包含了服务实例网络位置的数据库。本身需要具备高可用性,通常通过分布式一致性协议(如Raft、Paxos)来保证数据的一致性和可靠性。

比如:Netflix Eureka,它提供了一个用于注册和查询服务实例的 REST API。

服务实例使用 POST 请求注册其网络位置。每隔 30 秒使用 PUT 请求刷新其注册信息。通过使用 HTTP DELETE 请求或实例注册超时来移除注册信息。

客户端可以使用 HTTP GET 请求来检索已注册的服务实例。

其他的注册中心:etcd,Consul,Zookeeper这些,我在后面的文章中学习后再写出来

5.服务注册的方式

5.1 主动注册Self-Registration

过程:服务实例启动后,主动将自己的信息注册到服务注册中心。并通过发送心跳请求来防止注册信息过期。

适用场景:微服务架构中,服务实例与注册中心直接交互

服务发现3.png

示例:

  • Eureka
    • Spring Cloud中,服务通过 @EnableEurekaClient 注解实现主动注册。
    • 服务启动时向Eureka Server注册自身的元数据信息(IP、端口、健康状态等)。

优点:实现简单,由服务自己掌握注册逻辑;

缺点:服务代码耦合了注册中心逻辑,增加服务端复杂度,且注册中心故障可能影响服务启动。

5.2被动注册(Third-Party Registration)

又叫第三方注册,原理:服务实例本身不负责注册操作,而是通过外部代理或监控组件检测到服务的状态,当检测到新的可用服务实例时,然后将其注册到服务注册中心。

服务发现4.png

示例:

Kubernetes

  • 使用kubelet定期监测Pod的状态,并将Pod的网络信息注册到Kubernetes的Service中。

优点:服务实例与注册逻辑解耦,服务代码无侵入。适用于现有服务

缺点:依赖第三方组件,注册的实时性较低于主动注册

6. 总结服务发现的核心流程

  • 服务注册:服务启动时向注册中心注册自身的元数据。
  • 心跳检测:服务持续发送健康状态给注册中心,确保可用性。
  • 服务发现:消费者从注册中心获取服务实例信息。
  • 服务调用:消费者选择合适的实例进行调用(客户端负载均衡或服务端负载均衡)。
  • 服务注销:服务关闭时从注册中心注销自己的信息。

7.框架对比

面试过程中可能还会文档服务发现框架的区别,以及选型依据,可以提前准备一些框架的内容,这里简单列一下:

服务注册与发现框架 语言支持 一致性 健康检查 配置复杂性 性能 数据持久化 功能丰富度
Eureka Java 支持 简单 不支持 中等
Zookeeper 多语言 不支持 复杂 支持 中等
Consul 多语言 支持 简单 支持
Etcd 多语言 支持 复杂 支持 中等
Nacos 多语言 支持 简单 支持
DNS(K8S) 多语言 支持 中等
相关文章
|
5天前
|
存储 运维 安全
云上金融量化策略回测方案与最佳实践
2024年11月29日,阿里云在上海举办金融量化策略回测Workshop,汇聚多位行业专家,围绕量化投资的最佳实践、数据隐私安全、量化策略回测方案等议题进行深入探讨。活动特别设计了动手实践环节,帮助参会者亲身体验阿里云产品功能,涵盖EHPC量化回测和Argo Workflows量化回测两大主题,旨在提升量化投研效率与安全性。
云上金融量化策略回测方案与最佳实践
|
7天前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
6246 18
|
19天前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
11天前
|
自然语言处理 数据可视化 API
Qwen系列模型+GraphRAG/LightRAG/Kotaemon从0开始构建中医方剂大模型知识图谱问答
本文详细记录了作者在短时间内尝试构建中医药知识图谱的过程,涵盖了GraphRAG、LightRAG和Kotaemon三种图RAG架构的对比与应用。通过实际操作,作者不仅展示了如何利用这些工具构建知识图谱,还指出了每种工具的优势和局限性。尽管初步构建的知识图谱在数据处理、实体识别和关系抽取等方面存在不足,但为后续的优化和改进提供了宝贵的经验和方向。此外,文章强调了知识图谱构建不仅仅是技术问题,还需要深入整合领域知识和满足用户需求,体现了跨学科合作的重要性。
|
7天前
|
人工智能 容器
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
本文介绍了如何利用千问开发一款情侣刮刮乐小游戏,通过三步简单指令实现从单个功能到整体框架,再到多端优化的过程,旨在为生活增添乐趣,促进情感交流。在线体验地址已提供,鼓励读者动手尝试,探索编程与AI结合的无限可能。
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
|
1月前
|
存储 人工智能 弹性计算
阿里云弹性计算_加速计算专场精华概览 | 2024云栖大会回顾
2024年9月19-21日,2024云栖大会在杭州云栖小镇举行,阿里云智能集团资深技术专家、异构计算产品技术负责人王超等多位产品、技术专家,共同带来了题为《AI Infra的前沿技术与应用实践》的专场session。本次专场重点介绍了阿里云AI Infra 产品架构与技术能力,及用户如何使用阿里云灵骏产品进行AI大模型开发、训练和应用。围绕当下大模型训练和推理的技术难点,专家们分享了如何在阿里云上实现稳定、高效、经济的大模型训练,并通过多个客户案例展示了云上大模型训练的显著优势。
104578 10
|
11天前
|
Cloud Native Apache 流计算
资料合集|Flink Forward Asia 2024 上海站
Apache Flink 年度技术盛会聚焦“回顾过去,展望未来”,涵盖流式湖仓、流批一体、Data+AI 等八大核心议题,近百家厂商参与,深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ,可在线阅读和下载。
4205 10
资料合集|Flink Forward Asia 2024 上海站
|
4天前
|
弹性计算 运维 监控
阿里云云服务诊断工具:合作伙伴架构师的深度洞察与优化建议
作为阿里云的合作伙伴架构师,我深入体验了其云服务诊断工具,该工具通过实时监控与历史趋势分析,自动化检查并提供详细的诊断报告,极大提升了运维效率和系统稳定性,特别在处理ECS实例资源不可用等问题时表现突出。此外,它支持预防性维护,帮助识别潜在问题,减少业务中断。尽管如此,仍建议增强诊断效能、扩大云产品覆盖范围、提供自定义诊断选项、加强教育与培训资源、集成第三方工具,以进一步提升用户体验。
620 243
|
6天前
|
消息中间件 人工智能 运维
12月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
586 39
|
11天前
|
人工智能 自然语言处理 芯片
上千人挑战,用通义灵码从 0 开始打造一款 App 爆火 | 第二课:搭建本机服务
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。