专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%

本文涉及的产品
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
性能测试 PTS,5000VUM额度
注册配置 MSE Nacos/ZooKeeper,118元/月
简介: MSE 注册配置中心专业版完全兼容了 Eureka 协议,并对其读写性能、实例容量进行了大幅优化。


作者:涌月

审核&校对:彦林、草谷、望宸

编辑&排版:酒圆


Eureka 是一款优秀的注册与发现产品,其作为 Netflix 公司重要的开源项目,已经成为 Spring-cloud-netflix 生态默认的注册中心。在过去的数年中,Eureka 为大量的中国互联网公司提供了开箱即用的注册中心服务解决方案。


但由于 Eureka 开源社区停止维护,并且在业务规模增大的时候存在性能问题,因此需要寻找一个可替代的高性能注册中心,进行平滑迁移和演进。



Eureka 的性能问题


随着业务的发展,Eureka 逐步暴露出一些性能问题。上万量级实例的频繁变更、洪水般的流量请求,即便通过部署高配服务器,也无法解决 Eureka 的性能瓶颈:


1、服务状态更新滞后:由于 Eureka 存在缓存机制,基于其搭建的微服务系统通常会出现服务状态更新滞后,30-60s 才能够获取到准确的服务实例列表;


2、同步速度慢:当业务流量大时,为了保证高可用和高性能,通常 Eureka 需要以集群模式运行。然而,Eureka 集群之间的读写同步速度相对缓慢,即在一台 Eureka 上注册实例,需要等待较长延迟之后,才能在另一台机器上查询到相关信息,导致了业务出现经常线上 Bug。


1.png


Eureka的社区问题


除了上述的性能问题外,Eureka 社区当前已经宣布停止维护(如下图),锁死在一个不发展的社区上有很高的技术风险和不确定性。


2.png


MSE注册配置中心专业版的优势


为了降低 Eureka 技术体系停止维护的不确定性,并增强 Eureka 注册中心的稳定性和高并发能力,我们首次在 MSE 注册配置中心专业版(以下简称专业版)上完全兼容了 Eureka 协议,并对其读写性能、实例容量进行了大幅优化。


某大型教育机构用户反馈,相对于开源 Eureka,专业版性能大幅提升,目前已经在其业务场景中落地。专业版的核心能力和性能表现如下:


1、多协议支持:用户使用 Eureka 注册中心的实例,完全可以使用 Nacos 协议进行发现,保证用户技术栈的多层次兼容性;


2、高性能支持:极大地优化了读写同步速度,使得基于此搭建的微服务系统具有更高的性能和易用性;根据实验室的压测数据,MSE-Nacos 下的 Eureka 注册中心的读写性能、实例容量均提升达 50%以上。


3、融入服务网格生态:通过支持 MCP 协议和 XDS 协议,服务网格生态领域已完全兼容专业版的 Eureka 协议,为 Istio 接入 Eureka 提供零侵入、高性能的微服务以及网关解决方案。


1、对比压测报告


我们对开源 Eureka 和专业版,在读写性能、容量评估上进行了压测,主要包括如下两个场景。


  • 场景1: 容量评估测试


注册尽可能多的 App 和 Instance,并维持心跳,观察注册中心的容量。测试指标包括 Instance 容量、是否发生 Full GC 以及 CPU 开销。实验机器包括3*8C16G或10*8C16G,我们进行了不同注册规模的多次压测实验。


表1.jpg


容量方面,Eureka 容量较小,3 台机器容量超过 1.5w 就会出现大量同步超时报错,频繁发生 Full GC(每分钟至少发生一次)。


经过问题定位,Eureka 在容量测试场景中,其集群间批量复制较为频繁;另外,开源 Eureka 在初次超时之后,很快会将复制请求重试,导致泛滥,这是造成 CPU 飙升接近100%的主要原因。该问题也导致了 Eureka 的横向扩展性能瓶颈。


而专业版的容量超过 Eureka,只需 9 台机器就可以支持 6w 左右的实例规模;另外,其 Full GC 的频率大大降低,CPU 使用率维持在较低水位。


  • 场景2: 读写性能 TPS 测试


经过测试发现,Eureka 在大量频繁的写操作场景中,其集群间批量复制操作更加频繁,导致大量的 Timewait 线程;另外,Eureka 在初次超时之后,很快会将复制请求重试,导致泛滥,这是造成 CPU 飙升接近100%的主要原因。其表现形式是,在 Eureka 的 CPU 打满之后,Eureka 端会出现下方的报错,每台节点的响应速度达到瓶颈。


com.sun.jersey.api.client.ClientHandlerException: java.net.SocketTimeoutException: Read timed out


而专业版采用阿里云自研的 Distro 协议,对于数据进行分片,其集群间的数据同步粒度相对于开源 Eureka 更小。因此,专业版兼容的 Eureka 集群间数据同步量相对较低,CPU 开销较小。其 TPS 提升,RT 下降,整体性能提升了约50%。下面,我们再分别从读场景和写场景,分别对专业版和 Eureka 进行比对:


表2.jpg

读场景


表3.jpg

写场景



如何将开源 Eureka 迁移至专业版


相信看到这里,你一定想早点上车,但是你接着会问,是否支持无缝迁移呢?我们针对不同的场景分别提供了对应的解决方案。


1、云上自建 Eureka 用户如何迁移?


云上自建 Eureka 用户,可以直接按照 《将Spring Cloud应用从开源Nacos迁移到MSE Nacos》平滑迁移(见文末链接)。


2、已经购买 MSE 的用户如何迁移?


对于已经购买了 MSE 注册配置中心基础版的用户,我们也提供了平滑升级至专业版的能力。可以直接通过点击“实例规格变更”,并选择“专业版”进行操作。


3.png


4.png


整个迁移过程完全平滑,业务基本无感知。升级完成之后,用户便可以在专业版上,进行高性能的 Eureka 协议服务发现与注册了。



参考链接

《将Spring Cloud 应用从开源 Nacos 迁移到 MSE Nacos》:

https://help.aliyun.com/document_detail/263565.html


双十一大促,微服务引擎 MSE (注册配置中心和云原生网关)首购 8 折优惠!

点击下方链接,了解更多!

https://cn.aliyun.com/product/aliware/mse

相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
相关文章
|
7月前
|
存储 缓存 分布式计算
ZooKeeper、Eureka注册中心对比
ZooKeeper、Eureka注册中心对比
390 0
|
7月前
|
Java Spring
Eureka与Zookeeper的区别
     著名的CAP理论指出,一个分布式系统不可能同时满足C(一致性)、A(可用性)和P(分区容错性)。 由于分区容错性在是分布式系统中必须要保证的,因此我们只能在A和C之间进行权衡,在此Zookeeper 保证的是CP, 而Eureka则是AP。
|
2月前
|
分布式计算 负载均衡 算法
Hadoop-31 ZooKeeper 内部原理 简述Leader选举 ZAB协议 一致性
Hadoop-31 ZooKeeper 内部原理 简述Leader选举 ZAB协议 一致性
31 1
|
3月前
|
监控
分布式-Zookeeper-Zab协议
分布式-Zookeeper-Zab协议
|
4月前
|
消息中间件 分布式计算 安全
这一次,彻底弄懂ZooKeeper协议
ZooKeeper是动物园的意思,在2012年官方来给ZooKeeper写了这么一段有趣的“ZooKeeper之道”,难怪ZooKeeper现在发展得这么好。动物园管理员对他们负责的动物和参观动物的游客都尽心尽力。他们遵循一套守则,至今只有同行才知道,这套守则可以保证动物和游客的安全。大家好,我是南哥。一个Java学习与进阶的领路人,相信对你通关面试、拿下Offer进入心心念念的公司有所帮助。
143 4
这一次,彻底弄懂ZooKeeper协议
|
5月前
|
Nacos 微服务
Zookeeper 的 ZAB 协议 以及 zookeeper 与 nacos 注册中心比对
Zookeeper 的 ZAB 协议 以及 zookeeper 与 nacos 注册中心比对
95 4
|
7月前
|
容灾 Java 测试技术
低成本、高稳定性 |满帮集团 Eureka 和 ZooKeeper 的上云实践
充分了解和利用云的能力,能够让满帮技术团队从底层的持续投入中解脱出来,聚焦更上层的系统稳定性和工程效率,从架构层面实现更高的 ROI。
68061 17
|
7月前
|
容灾 Java 测试技术
低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践
业务体量增大后,日益凸显的架构稳定性问题该如何解决?满帮集团选择了上阿里云,采用阿里云 MSE Nacos,MSE ZooKeeper 产品替换原先的 Eureka 和 Zookeeper 集群,做到了低成本快速的架构升级,以及上云期间业务流量的无损平滑迁移。
57157 15
|
7月前
|
消息中间件
【ZooKeeper系列】那ZooKeeper为什么还采用ZAB协议
ZooKeeper的流程是这样的,针对客户端的事务请求,Leader服务器会为其生成对应的事务Proposal,并发送给集群中其余机器,然后再分别收集各自的选票。因为ZAB协议将二阶段提交中的事务中断逻辑移除,所以只需要收集过半Follower服务器的反馈Ack后即可,最后就是进行事务提交。
【ZooKeeper系列】那ZooKeeper为什么还采用ZAB协议
|
7月前
|
存储 负载均衡 网络协议
ZooKeeper【基础 01】简介+设计目标+核心概念+ZAB协议+典型应用场景
【4月更文挑战第10天】ZooKeeper【基础 01】简介+设计目标+核心概念+ZAB协议+典型应用场景
94 1

热门文章

最新文章

相关产品

  • 微服务引擎