面试官:什么是连接池?

简介: 啊,这....小马曾经也很好奇这是个什么玩意,后面写GO的时候因为要自己实现DB层和redis层,才对它有了更进一步深入的了解。但要是正儿八经地说呢,也不知道该怎么描述。还是借助网络上各路大神的文章来抛玉引我这个砖吧。

啊,这....小马曾经也很好奇这是个什么玩意,后面写GO的时候因为要自己实现DB层和redis层,才对它有了更进一步深入的了解。但要是正儿八经地说呢,也不知道该怎么描述。还是借助网络上各路大神的文章来抛玉引我这个砖吧。

一、什么是连接池

借用网文《如何实现一个连接池?一文带你深入浅出,彻底搞懂!》来说明吧,再次感谢作者。

注意小马加粗的文字部分。

“池”是一种非常形象化的描述,它是一种容器,做储存之用;在编程中我们往往使用数组、链表、队列、map来表达。实现的代码原理是比较好理解的。

“连接”是网络中用于传输数据的通道;“连接”才是我们要真正去使用的对象,而“池”是用来管理“多个连接”的一种方式。

如果没有用“池”来统一管理“连接”,“连接”将散布在程序各处;那为了使用方便,我们往往会在使用时建立连接,使用完毕后,就关闭连接。所以“连接池”给我们提供了使用“连接”的方便。

同时,池是做储存之用的,所以“连接池”中的“连接”肯定是已经建立好的长连接,比如tcp连接、websocket连接等,即取即用,用完放回(池里存储的实质是一堆已创建好的连接对象,参考这里)。如果没有真正理解“连接池”的本质,在面试中可能会出现“http连接池”的笑话!(但这里小马有个疑问,但是http的底层不是tcp吗,而且http从HTTP/1.1起,默认使用长连接了,既然长连接为什么不能有连接池的概念?换句话说,只要是长连接是不是都可以搞连接池)

根据下游类型,我们常见有数据库连接池、缓存连接池、服务连接池,如下图所示:
image.png

image.png

image.png

在编程中,我们还经常会碰到进程池(记得小马曾经有被问到swoole的进程模型,进程池)、线程池、协程池、内存池、对象池等。

二、为什么需要连接池

除了连接池能非常方便的对连接进行管理外,一句话,在高吞吐时连接池大大提高了数据传输的效率。

从两个方面说:

1、避免反复的三次握手和四次握手

长连接的建立需要进行三次握手,而连接的释放需要进行四次握手,这是发生在系统层面的两个动作,对于单条连接来说耗时微乎其微,但在高吞吐场景时,耗时则不能忽略。

所以连接池的即取即用和用完放回的特性,避免了大量三次握手和四次握手的无效耗时,节省了系统资源。

2、 增加并行车道,实现全双工并行,提高QPS

数据通信包括单工、半双工和全双工。单工通信如下图,数据只能从A到B,不符合访问下游服务的场景。

image.png

半双工通信如下图,数据可以从A到B,也可从B到A,但是同一时刻只能一个方向上进行数据传输,通道利用率是50%。
image.png

全双工通信如下图,可同时存在从A到B和从B到A的数据传输,通道的利用率是100%。长连接就是全双工通信。
image.png

在IO密集型的互联网应用中,一条全双工通信通道仍然无法满足数据吞吐的需求时,该如何解决?

在互联网性能测试指标中有这样一个公式:

QPS(吞吐量) = 并发数 / 平均响应时间

在平均响应时间不变的情况下,适度增加并发数可以提升吞吐量;所以采用多条全双工通信的方式可以在一定程度上(平均响应时间没有大幅增加)提高吞吐量,而连接池则就最好的实现方式。

总结一下:为什么需要连接池?

(1)方便管理连接;

(2)避免反复三次握手和四次握手;

(3)更好地实现全双工并行。

三、如何实现一个连接池

image.png

该连接池的“池”通过队列数据结构进行实现,队列先进先出的特性保证了使用连接的均衡性,每一条连接都可以均匀的被使用到。

连接池对外提供get()和free()两个API,get()用于从队首“出队”获取一条可用连接,free()用于将使用完的连接从对尾“入队”释放到队列中。

业务代码在低峰时会降低get()动作,所以连接池中的连接在长时间不用时会导致失效,此时保活线程在监测到get()的使用频率较低时,会模拟业务程序调用get()获取连接后发送心跳包,然后再通过free()将被保活的连接放回队列中,达到连接池中所有连接保活的目的。

那么小马的问题来了,我们平时使用的连接池lib,通常在连接使用完会调用一下close()函数,这个函数的真实动作是直接关闭连接吗?

显然根据本文的分析答案是否定的。

使用完后必须 con.close() 掉 ,使用连接池的话,执行 con.close 并不会关闭与数据库的 TCP 连接,而是将连接还回到池中去,如果不 close 掉的话,这个连接将会一直被占用,直接连接池中的连接耗尽为止。

至于是如何做到 con.close 并不是真正意义上的关闭连接?而是直接将连接还回到池中去? 非本文中重点不赘述,参考这里。】

四、扩展知识:高级连接池

高级连接池通常应用在微服务系统中,如下图:连接池连接下游多个节点。
image.png

高级连接池


高级连接池具备这样几个特性:

1、 高可用:下游任意一个server 宕机时,连接池会关闭相关无效连接,防止被client访问;

2、 高可扩展:下游增加一个server节点时,连接池会发现并建立到新server节点的连接,供client访问;

3、 负载均衡:连接池会根据下游server的服务能力的高低分配数据请求;

4、 中间件:当下游server是类MySQL数据库并分片时,连接池会将请求打在相应的数据节点上,并对数据进行聚合。

小马的疑问:微服务之间的PRC通信协议grpc也是需要处理连接池的吗?好像没有建立长连接吧?本文中的高级连接是针对长连接的地方而言吗?比如http2协议。
对于微服务用例,将HTTP / 1.1与HTTP / 2进行比较,通常HTTP / 1.1连接池要大得多(例如10倍) -50x),而不是HTTP / 2连接池,但出于上述原因,您仍然希望使用HTTP / 2连接池。
有待进一步探究...

相关文章
|
4月前
|
druid Java 数据库连接
Java面试题:解释数据库连接池的概念及其作用,讨论常见的连接池实现。
Java面试题:解释数据库连接池的概念及其作用,讨论常见的连接池实现。
81 0
|
3月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。
|
8天前
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
|
9天前
|
存储 缓存 Java
大厂面试必看!Java基本数据类型和包装类的那些坑
本文介绍了Java中的基本数据类型和包装类,包括整数类型、浮点数类型、字符类型和布尔类型。详细讲解了每种类型的特性和应用场景,并探讨了包装类的引入原因、装箱与拆箱机制以及缓存机制。最后总结了面试中常见的相关考点,帮助读者更好地理解和应对面试中的问题。
33 4
|
1月前
|
算法 Java 数据中心
探讨面试常见问题雪花算法、时钟回拨问题,java中优雅的实现方式
【10月更文挑战第2天】在大数据量系统中,分布式ID生成是一个关键问题。为了保证在分布式环境下生成的ID唯一、有序且高效,业界提出了多种解决方案,其中雪花算法(Snowflake Algorithm)是一种广泛应用的分布式ID生成算法。本文将详细介绍雪花算法的原理、实现及其处理时钟回拨问题的方法,并提供Java代码示例。
67 2
|
1月前
|
JSON 安全 前端开发
第二次面试总结 - 宏汉科技 - Java后端开发
本文是作者对宏汉科技Java后端开发岗位的第二次面试总结,面试结果不理想,主要原因是Java基础知识掌握不牢固,文章详细列出了面试中被问到的技术问题及答案,包括字符串相关函数、抽象类与接口的区别、Java创建线程池的方式、回调函数、函数式接口、反射以及Java中的集合等。
28 0
|
3月前
|
Java C++
【Java基础面试十七】、Java为什么是单继承,为什么不能多继承?
这篇文章讨论了Java单继承的设计原因,指出Java不支持多继承主要是为了避免方法名冲突等混淆问题,尽管Java类不能直接继承多个父类,但可以通过接口和继承链实现类似多继承的效果。
【Java基础面试十七】、Java为什么是单继承,为什么不能多继承?
|
3月前
|
存储 安全 Java
这些年背过的面试题——Java基础及面试题篇
本文是技术人面试系列Java基础及面试题篇,面试中关于Java基础及面试题都需要了解哪些内容?一文带你详细了解,欢迎收藏!
|
3月前
|
XML 存储 JSON
【IO面试题 六】、 除了Java自带的序列化之外,你还了解哪些序列化工具?
除了Java自带的序列化,常见的序列化工具还包括JSON(如jackson、gson、fastjson)、Protobuf、Thrift和Avro,各具特点,适用于不同的应用场景和性能需求。
|
3月前
|
Java
【Java基础面试三十七】、说一说Java的异常机制
这篇文章介绍了Java异常机制的三个主要方面:异常处理(使用try、catch、finally语句)、抛出异常(使用throw和throws关键字)、以及异常跟踪栈(异常传播和程序终止时的栈信息输出)。