Thrift多路复用:增强Thrift以满足企业期望(上)

简介: Thrift多路复用:增强Thrift以满足企业期望

Thrift是一个加快高效、可扩展后端服务开发和实现的开源库,它轻量级框架和对跨语言通信的支持,使得它的许多操作比其他类似SOA(REST/SOAP)的RPC框架更强大、高效。然而,Thrift的能力倍受新兴企业解决方案的挑战,例如,大数据方面,由于一个端口绑定一个服务的局限性,增加了绑定多种业务的企业网络的可维护性和管理的成本。本文针对这一挑战,详细介绍了增强Thrift能力的实现方法,使其能满足企业的期望。

介绍

Thrift是一个非常轻量的用于开发和获取远程服务的框架,它在跨语言通信方面,可靠,扩展性好、高效。Thrift API 被各企业广泛用于创建如搜索,日志记录,移动广告等类似服务和开发者平台。HBase、Hive、Cassandra等大数据开源项目的服务都承载于Thrift。简单,版本控制支持,开发高效和可扩展性使其成为SOA市场的有力竞争者,帮助它在与多数已有集成方法和产品的竞争中取得成功。

Thrift具有支持大量的功能,服务的跨语言沟通能力。这种能力可以通过扩展Thrift支持在每个服务器上绑定多个services得到进一步加强。在本白皮书中,我们将讨论如何提高Thrift的能力,以善用企业资源。基于标准的环境,我们还提出了一个框架,可以支持服务器绑定多个services的创建,服务的注册和服务的查询。

Thrift有何特别之处?

在开源舞台上有多种类型的RPC实现,包括Thrift、Avro、MessagePack、Protocol Buffers、BSON等等。每一个RPC实现库都有自己的优点和缺点。理想情况下,我们应该根据项目特定的企业解决方案的需求选择RPC库。

所有RPC实现追求的特性:

1.跨平台通信

2.多种编程语言

3.支持快速协议(本地,二进制,压缩等)

4.支持多种传输

5.灵活的服务器(配置无阻塞,多线程等)

6.标准的服务器和客户端实现

7.与其他的RPC库的兼容性

8.支持不同的数据类型和容器

9.支持异步通信

10.支持动态类型(无架构编译)

11.快速序列化

与其他RPC实现,Thrift、Avro、MessagePack是顶级竞争者,满足以上列出的大多数需求。Avro的实现中,低频会话时服务器和客户端的带外模式会成为过度之举。同时,MessagePack本质上基于JSON并且无scheme的类型检查,由于数据类型容器的缺乏,比Thrift要弱。另一方面,支持各种协议和传输,可配置的服务器,简单标准化的IDL,和久经实战集成于大数据NoSQL数据存储,如Cassandra,使Thrift成为一个强大的竞争者和企业解决方案的首选RPC实现。

Thrift功能强大,但尚缺少功能

尽管是一个强大、高效率的跨语言通讯的工具,Thrift的services倍受高管理和维护成本的挑战。实际上,每一个Thrift服务器能够在同一时间公开唯一一个service。为了绑定多种功能,Thrift为企业提供以下两个选项:

1.写一个唯一、笨拙的实现并丙丁它作为单一服务

2.绑定多个小服务到一系列端口

如果企业做选择第一种选项:那么,唯一、笨重的实现增加了解决方案的开发成本。该解决方案的复杂性将随着每个新服务的增加而增长。投资回报率(ROI)将由于高昂的维护成本受到不利影响。

如果企业选择第二种选项,绑定多个服务消耗的端口数量会很高,由于端口是一种有限的企业资源,需要谨慎使用,这是一个严重的问题。此选择倍受高管理和维护成本的挑战。此外,为防止与每个调用连接建立的相关成本,客户端的必须保持很多的链接(至少有一个到每一个端口)。每增加一个新的service,必须在防火墙上打开新的端口。Thrift的灵活设计在解决方案的优势备受高管理成本的挑战。

通过复用为优秀的API增加魅力

需要一个小时以实现和利用Thrift API的潜力,克服每个服务器绑定唯一service的局限。这份白皮书提出的解决方案是试图建立一个框架,可以使Java开发人员能够在每个服务器上创建和绑定多个services。该解决方案还提供了一个查询的框架,任何Java客户机/服务器可以快捷方便的查找和使用每个服务器上所托管的services,

方案

基本的方法是分配一个本文称作“service context”的符号给每个服务。这将帮助我们绑定多个services到一个服务器上,每一个service可以被各自的service context识别。使用查找服务的客户端应该能够获取合适的service context,并引导服务调用到各自的服务者。

组件

该解决方案扩展了Thrift API引进一些如下提到的新的组件(图1.3红色边界高亮):

Multiplexer

复用器(Multiplexer)是Processor,是本方案的核心。该组件作为服务器端请求代理并负责根据由客户端传输的service context识别客户端请求。此组件保持service context和service之间的映射。在处理任何请求时,它读取来自底层协议的service context,并根据该映射,将请求定向到适当的service。

Protocol

在我们的方法中,我们使我们的解决方案transport和protocol无关。我们创建了一层底层协议(协议的任何实例)的封装,客户端侧把service context嵌入消息,并在服务端侧查找它。因此,我们增加了一个新的类TMultiplexProtocol包装现有的TProtocol,它重写writeMessageBegin (TMessage)和readMessageBegin()方法的行为。所有与TMultiplexer进行通信的客户端需要使用TMultiplexProtocol实例来包装底层协议。

Registry and Lookup

为了减少与手动管理service context相关的开销,我们在此解决方案中创建了一个registry组件,负责管理托管在特定服务器上的所有service。该组件托管为底层复用器上的一个service,客户端可以通过在TMultiplexerConstants.LOOKUP_CONTEXT查询绑定service的相关信息进行查询。TRegistry是基本的用于查询lookup registry的客户端侧API接口。它提供了多种查询方法查询registry,如基于service context、服务名称、正则表达式。这也方便了用户使用registry检查任何service context的存在,以及列出所有可用的服务上下文。TRegistryHelper是服务端侧的API接口,它使用lookup registry用于绑定,重新绑定和解除绑定service context。我们已经提供了registry API的基本实现,执行service context内存管理的TRegistryBase。基于特定的需求,该组件可以通过覆盖默认方法进行扩展,并且可以与工厂类一起使用。TRegistryClientFactory是用于创建registry client的工厂类,便于远程查找registry。

Service Information

本解决方案采用了URIContext类体现/代表绑定在特定服务器上的services的信息。这个对象能够在网络中传输;,因此客户端可以远程访问。service context、服务名称和描述由目前的解决方案代表作为该信息的一部分。

#####Multiplexer-extension for lookup

就其本身而言,Multiplexer能够绑定多个service。然而,管理服务信息是客户端和服务端管理者的成本。为了减少这方面的成本,我们引入了registry组件,能够管理服务信息。为了充分利用在单处理器的Multiplexer和registry组件的能力,我们引入了新的processor TLookupMultiplexer,能够使用一个额外的基于registry的查找服务承载多个service。因此,处理器创建一个拥有所有service信息的registry的实例,并将其公开为一项额外的服务给客户。使得客户端能够使用Registry API,并使用查询后所得到的service context访问底层服务。

目录
相关文章
|
JSON 网络协议 Dubbo
RPC框架(技术总结)
RPC框架(技术总结)
RPC框架(技术总结)
|
21天前
|
Dubbo 安全 应用服务中间件
Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议,弱网效率提升 6 倍
在 Apache Dubbo 3.3.0 版本之后,官方推出了全新升级的 Triple X 协议,全面支持 HTTP/1、HTTP/2 和 HTTP/3 协议。本文将围绕 Triple 协议对 HTTP/3 的支持进行详细阐述,包括其设计目标、实际应用案例、性能测试结果以及源码架构分析等内容。
|
Dubbo Java 测试技术
分布式RPC框架性能大比拼 dubbo、motan、rpcx、gRPC、thrift的性能比较
Dubbo 是阿里巴巴公司开源的一个Java高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和 Spring框架无缝集成。不过,略有遗憾的是,据说在淘宝内部,dubbo由于跟淘宝另一个类似的框架HSF(非开源)有竞争关系,导致dubbo团队已经解散(参见http://www.oschina.net/news/55059/druid-1-0-9 中的评论),反到是当当网的扩展版本仍在持续发展,墙内开花墙外香。
7301 0
|
1月前
|
自然语言处理 负载均衡 API
gRPC 一种现代、开源、高性能的远程过程调用 (RPC) 可以在任何地方运行的框架
gRPC 是一种现代开源高性能远程过程调用(RPC)框架,支持多种编程语言,可在任何环境中运行。它通过高效的连接方式,支持负载平衡、跟踪、健康检查和身份验证,适用于微服务架构、移动设备和浏览器客户端连接后端服务等场景。gRPC 使用 Protocol Buffers 作为接口定义语言,支持四种服务方法:一元 RPC、服务器流式处理、客户端流式处理和双向流式处理。
|
2月前
|
网络协议 算法
RPC为何比较高效?
RPC为何比较高效?
63 0
|
7月前
|
Dubbo 网络协议 Java
性能基础之常见RPC框架浅析
【4月更文挑战第23天】性能基础之常见RPC框架浅析
265 1
性能基础之常见RPC框架浅析
|
SQL 分布式计算 NoSQL
Thrift多路复用:增强Thrift以满足企业期望(下)
Thrift多路复用:增强Thrift以满足企业期望(下)
138 0
|
存储 网络协议 Dubbo
如何设计可向后兼容的RPC协议
HTTP协议(本文HTTP默认1.X)跟RPC协议又有什么关系呢?都属于应用层协议。
129 0
|
Dubbo Java 测试技术
Dubbo3实践:Triple Streaming 流式通信编程示例
具体用例可以参考:[dubbo-samples-triple/pojo](https://github.com/apache/dubbo-samples/tree/master/dubbo-samples-triple/src/main/java/org/apache/dubbo/sample/tri/pojo); ## 开启 Triple 新特性 —— Stream (流) Stream 是
885 0
|
XML JSON 运维
【RPC基础系列2】一文搞懂gRPC和Thrift的基本原理和区别
之前对于gRPC和Thrift只停留在会用的阶段,虽然也初步了解过两者的执行流程,但时间一长又忘了,如果让我评估两者如何选型,我更是蒙圈。所以就想把之前学习的知识整理一下,来填补自己的知识盲区。
1101 0
【RPC基础系列2】一文搞懂gRPC和Thrift的基本原理和区别