谈谈我所经历过的 RPC

简介: 本文讲述了企业从.NET迁移到Java过程中RPC框架的演进:从ICE到Hessian,再到Dubbo,最终走向自研RPC与服务治理。随着业务发展,集中式架构瓶颈凸显,Zookeeper压力剧增,促使团队探索更高效方案。在云原生时代,RPC能力正逐步下沉至K8S基础设施,迈向Mesh化新阶段。RPC不仅是调用工具,更是分布式系统基石,值得深入掌握。

CE这就存在一个问题,我们是怎么把.Net 应用平滑地切换到 Java 上呢?原本是.Net 应用之间的互相调用,需要改成.Net 跟 Java 之间互相通信。为了解决这个问题,我们当时选择了一个比较古老的 RPC 框架 ICE(https://zeroc.com),可能现在很多人都没有听说过了。Hessian后面使用 Java 开发应用的机会越来越多,而且随着 Spring 开发方式的大流行,在 Java 应用里面使用 ICE 来完成应用之间的 RPC 调用就变得比较鸡肋了。所以当时我们用了一种新的 RPC 框架 Hessian(http://hessian.caucho.com/),这时我们就把 Java 应用之间的 RPC 调用方式改成了 Hessian 方式。用 Hessian 的原因就是因为它可以很好地跟 Spring 进行集成,对 Spring 项目的开发人员来说,开发一个 RPC 接口就变得很容易了,我们可以直接把 Java 类对外进行暴露,用作 RPC 接口的定义,而不需要像 ICE 一样先定义 Stub。单纯的从 RPC 框架角度出发,Hessian 是一款很优秀的产品,即使放到今天,它的性能和鲁棒性都有着很强的参考意义。但当业务发展壮大到一定程度后,应用之间的调用就不仅仅需要考虑用什么 RPC 框架了,更多的是需要考虑怎么去完成服务治理。另外一个原因就是因为 Hessian 是没有服务发现功能的,我们只能通过 VIP 暴露的方式完成调用,我们需要给每个应用分配一个 VIP,把同一接口的所有服务提供方实例挂载到同一个 VIP 上。这种集中式流量转发架构就会使得提供 VIP 服务的 LVS 存在很大的压力,而且集中式流量的转发会让调用方响应时间相对变长。Dubbo为了解决类似 Hessian 这种集中式问题,实现大规模应用服务化的落地,国内的 RPC 框架 Dubbo 的做法就显得比较先进了。随着业务越来越复杂,应用之间的调用关系也就变得更加错综复杂,所以后面我们也是选择基于 Dubbo 进行扩展,以完成 RPC 通信,而服务发现则通过接入 Zookeeper 集群来完成。通过这种现有框架的搭配,我们完成了应用服务化的快速落地,也同时完成了统一公司内部所有应用 RPC 框架的目标。但随着微服务理念越来越流行,很多应用的接口也是越拆越细,导致我们 Zookeeper 集群需要接入的接口数量越来越多;还有就是因为我们每年的业务量是成倍增长,为了让应用能够抗足够的调用量应用,我们也需要经常扩容,从而导致 Zookeeper 集群接入的 IP 实例数也是呈数量级增长的,这使得我们的 Zookeeper 集群负荷特别重。再有就是 Dubbo 相对有点复杂,而且性能还有提高空间,这使得我们不得不考虑新的方案。自研 RPC在这种背景下,我们决定自行研发一套适合自己业务场景的微服务解决方案,包括 RPC 框架、服务治理以及多语言解决方案。至此我们自研的 RPC 就一直平稳地支持着公司内的各种业务。这几年,在以 K8S 为代表的基础设施演进过程中,一个重要的关键词就是应用基础设施能力的下沉。在过去我们给应用提供 RPC 能力的时候,都是需要应用引入 Jar 包方式来解决的,在 RPC 里面,我们要把服务发现、路由等一整套 RPC 解决方案都融入到这个 Jar 里面去。未来目前,K8S 已成为基础设施的事实标准。而原先通过 Jar 包的方式封装的各种基础设施能力,现在全都被 K8S 项目从应用层拽到了基础设施中。那对于我们 RPC 来说也是一样,我们需要把非业务功能从传统的 RPC 框架中剥离出来,下沉到基础设施并且融入基础设施,然后通过 Mesh 去连接应用和基础设施。这也是 RPC 发展的下一个阶段,完成所有应用的 Mesh 化。所以说,RPC 这条路没有尽头,只有不断的挑战和乐趣。希望你也能爱上它!那最后我还想和你谈谈我对 RPC 的看法。可能大家在谈论 RPC 时候,都想着 RPC 只是解决应用之间调用的工具。从本质上来讲,这没有什么问题,但在现实中,我们需要 RPC 解决更多的实际问题,比如服务治理,这些东西都是在使用 RPC 的过程中需要考虑的问题,所以我个人认为 RPC 应该是一个比较泛的概念。当然,可能我们中大多数人现在是没有机会去完整实现一个新的 RPC 的,这不仅是精力的问题,更多是实际需求的问题,那为什么我们还需要学好 RPC 呢?我的想法很简单也非常实在,就是因为 RPC 是我们构建分布式系统的基石,就好比我们每次都是从 Hello World 开始学习一门新的编程语言。期待你能打牢这个基础,总有一天你会体验到它的能量!


相关文章
|
3月前
|
人工智能 关系型数据库 API
AI数字员工哪个好?2025十大品牌云原生适配实测:玄晶引擎/百度/阿里全链路方案
本文基于阿里云生态实测,解析AI数字员工从“可视化”到“业务落地”的转型趋势,揭露选型两大陷阱,结合玄晶引擎等50+案例与API性能数据,发布十大品牌榜单。聚焦云原生架构、API对接效率、开发友好度与全链路闭环四大维度,提供中小微企业至中大型企业的优选方案及开发者专属选型工具包,助力低成本高效落地。
620 8
|
3月前
|
缓存 JSON API
1688 商品详情 API 接口实战指南
1688开放平台alibaba.item.get接口,用于获取商品全量信息,支持选品、ERP同步等场景。需企业认证、申请权限并配置IP白名单。通过AppKey/Secret生成签名,调用时指定item_id等参数,返回商品标题、价格、SKU、图片等字段。默认5次/秒调用频次,建议按需请求、本地缓存、异步处理以提升效率。
|
3月前
|
人工智能 自然语言处理 Java
AI工具选择困难症?Spring AI帮你省掉64%的令牌费用
你的AI助手有50+个工具但每次对话前就烧掉55000个令牌?就像带着全套工具箱去拧个螺丝一样浪费!Spring AI的工具搜索模式让AI按需发现工具,实现34-64%的令牌节省,告别工具选择困难症和账单焦虑。#Spring AI #工具优化 #令牌节省 #AI开发
513 2
|
3月前
|
测试技术
22丨动态分组:超高效实现秒级扩缩容
本文讲解如何通过动态分组实现服务集群的流量隔离与弹性扩容。针对调用方突发流量问题,提出基于注册中心修改分组信息的动态扩缩容方案,提升系统应对能力,降低资源冗余成本,并探讨分组名不一致时的潜在解决方案。
22丨动态分组:超高效实现秒级扩缩容
|
3月前
|
存储 自然语言处理 JavaScript
TypeWords:让英语学习更高效的打字练习神器
TypeWords是一款开源英语学习工具,将打字与背单词、文章背诵结合,通过智能记忆曲线和多种练习模式,让英语学习更高效有趣。支持在线使用或本地部署,已获5.9k GitHub星标。
1039 161
TypeWords:让英语学习更高效的打字练习神器
|
6月前
|
存储 机器学习/深度学习 人工智能
阿里云环境下 Runway 深度部署:从技术原理到 AIGC 视频生成落地
Runway作为AI视频生成标杆,融合扩散模型与多模态技术,依托潜空间优化与时空注意力机制,实现高效高质视频生成。结合阿里云算力与API生态,支持版权合规、运镜控制与多模态联动,广泛应用于影视、广告与游戏领域,推动内容创作智能化升级。
1080 0
|
3月前
|
机器学习/深度学习 存储 安全
别只会One-Hot了!20种分类编码技巧让你的特征工程更专业
分类变量需编码为数字才能被模型处理。本文详解20种编码方法,从基础的独热、序数编码到高级的目标编码、CatBoost、WOE等,涵盖适用场景与代码示例,助你提升模型性能,避免泄露与过拟合,是特征工程中不可或缺的实用指南。
268 14
别只会One-Hot了!20种分类编码技巧让你的特征工程更专业
|
人工智能 供应链 安全
你的AI,能过真实电商这一关吗?
EcomBench是由通义实验室与SKYLENAGE联合推出的电商AI评测基准,基于真实平台数据,涵盖政策、成本、选品等七大任务,设三档难度,全面检验AI在复杂商业场景下的综合能力,推动电商智能体从“会说话”到“会做事”的跨越。
262 0
|
3月前
|
人工智能
基于vite7.2+vue3.5+deepseek-v3.2高颜值流式ai会话助手
基于vue3.5+vite7.2+vant4+markdown+openai深度集成deepseek-v3.2聊天大模型。支持浅色+深色主题、stream流式输出、代码高亮、复制代码、katex公式、mermaid图表等功能。
184 3
|
3月前
|
弹性计算 搜索推荐 应用服务中间件
阿里云服务器收费标准_云服务器ECS价格表_轻量优惠活动
阿里云服务器优惠汇总:轻量应用服务器200M带宽38元起/年,ECS云服务器2核2G 99元/年,2核4G 199元/年,4核16G 89元/月,8核32G 160元/月,香港轻量服务器25元/月起,支持按小时计费,新老用户同享,续费同价,限时秒杀低至1折。
965 18