池化技术
池化技术能够减少资源对象的创建次数,提高程序的响应性能,特别是在高并发下这种提高更加明显。 使用池化技术缓存的资源对象有如下共同特点:
1. 对象创建时间长;
2. 对象创建需要大量资源;
3. 对象创建后可被重复使用
像常见的线程池、内存池、连接池、对象池都具有以上的共同特点。
什么是数据库连接池
定义:数据库连接池(Connection pooling)是程序启动时建立足够的数据库连接,并将这些连接组成 一个连接池,由程序动态地对池中的连接进行申请,使用,释放。
大白话:创建数据库连接是一个很耗时的操作,也容易对数据库造成安全隐患。所以,在程序初始化的 时候,集中创建多个数据库连接,并把他们集中管理,供程序使用,可以保证较快的数据库读写速度, 还更加安全可靠。
这里讲的数据库,不单只是指Mysql,也同样适用于Redis。
为什么使用数据库连接池
资源复用
由于数据库连接得到复用,避免了频繁的创建、释放连接引起的性能开销,在减少系统消耗的基础 上,另一方面也增进了系统运行环境的平稳性(减少内存碎片以及数据库临时进程/线程的数量)。
更快的系统响应速度
数据库连接池在初始化过程中,往往已经创建了若干数据库连接置于池中备用。此时连接的初始化工作均已完成。对于业务请求处理而言,直接利用现有可用连接,避免了从数据库连接初始化和释放过程的开销,从而缩减了系统整体响应时间。
统一的连接管理,避免数据库连接泄露
在较为完备的数据库连接池实现中,可根据预先的连接占用超时设定,强制收回被占用连接。从而避免了常规数据库连接操作中可能出现的资源泄露。
不使用连接池
1. TCP建立连接的三次握手(客户端与MySQL服务器的连接基于TCP协议)
2. MySQL认证的三次握手
3. 真正的SQL执行
4. MySQL的关闭
5. TCP的四次握手关闭
可以看到,为了执行一条SQL,需要进行TCP三次握手,Mysql认证、Mysql关闭、TCP四次挥手等其他 操作,执行SQL操作在所有的操作占比非常低。
优点:实现简单 省了连接池的设计。
缺点:每一次发起SQL操作都经历TCP建立连接、数据库用户身份验证、数据库用户登出、TCP断开连接
网络IO较多
带宽利用率低
QPS较低
应用频繁低创建连接和关闭连接,导致临时对象较多,带来更多的内存碎片
在关闭连接后,会出现大量TIME_WAIT 的TCP状态(在2个MSL之后关闭)
使用连接池
第一次访问的时候,需要建立连接。 但是之后的访问,均会复用之前创建的连接,直接执行SQL语句。
优点:
1. 降低了网络开销
2. 连接复用,有效减少连接数。
3. 提升性能,避免频繁的新建连接。新建连接的开销比较大
4. 没有TIME_WAIT状态的问题
缺点:
1. 设计较为复杂
长连接和连接池的区别
长连接是一些驱动、驱动框架、ORM工具的特性,由驱动来保持连接句柄的打开,以便后续的数据库操作可以重用连接,从而减少数据库的连接开销。
而连接池是应用服务器的组件,它可以通过参数来配置连接数、连接检测、连接的生命周期等。 连接池内的连接,其实就是长连接。
数据库连接池运行机制
1. 从连接池获取或创建可用连接;
2. 使用完毕之后,把连接返回给连接池;
3. 在系统关闭前,断开所有连接并释放连接占用的系统资源;
连接池和线程池的关系
连接池和线程池的区别:
线程池:主动调用任务。当任务队列不为空的时候从队列取任务取执行。
比如去银行办理业务,窗口柜员是线程,多个窗口组成了线程池,柜员从排号队列叫号执行。
连接池:被动被任务使用。当某任务需要操作数据库时,只要从连接池中取出一个连接对象,当任务使用完该连接对象后,将该连接对象放回到连接池中。如果连接池中没有连接对象可以用,那么该任务就必须等待。
比如去银行用笔填单,笔是连接对象,我们要用笔的时候去取,用完了还回去。
连接池和线程池设置数量的关系:
一般线程池线程数量和连接池连接对象数量一致;
一般线程执行任务完毕的时候归还连接对象;
连接池设计要点
使用连接池需要预先建立数据库连接。
线程池设计思路:
1. 连接到数据库,涉及到数据库ip、端口、用户名、密码、数据库名字等;
1. 连接的操作,每个连接对象都是独立的连接通道,它们是独立的 (长连接)
2. 配置最小连接数和最大连接数
2. 需要一个队列管理他的连接,比如使用list;
3. 获取连接对象:
4. 归还连接对象;
5. 连接池的名字
连接池设计逻辑
构造函数
初始化
请求获取连接
归还连接
析构连接池
连接池名
mysql连接重连机制
设置启用(当发现连接断开时的)自动重连
my_bool reconnect = true; mysql_options(m_mysql, MYSQL_OPT_RECONNECT, &reconnect); // 配合mysql_ping实现自动重连 mysql_options(m_mysql, MYSQL_SET_CHARSET_NAME, "utf8mb4"); // utf8mb4和utf8区别 // mysql utf8只支持3个字节的unico , utf8mb4才是支持4个字节的unico
检测连接是否正常
int STDCALL mysql_ping(MYSQL *mysql);
描述: 检查与服务端的连接是否正常。连接断开时,如果自动重新连接功能未被禁用,则尝试重新连接服务器。该函数可被客户端用来检测闲置许久以后,与服务端的连接是否关闭,如有需要,则重新连接。 返回值: 连接正常,返回0;如有错误发生,则返回非0值。返回非0值并不意味着服务器本身关闭掉,也有可能是网络原因导致网络不通。
redis重连机制
1. 使用之前检测连接是否可用
2. 使用过程中出现连接异常则释放异常
3. 下一次使用该连接的时候如果发现连接不可用则重新初始化
redis的重连机制设计和mysql有区别。
mysqlpool测试
本地虚拟机测试 Ubuntu 16.04 cpu逻辑核数4 插入1000条数据
理论:io密集型线程池线程数量 = 2*cpu核数 +( 1/2) = 2 * 4 + (1/2) = 9 , 10个线程
为什么这里在32~64个线程之间效率是最高?
阿里云服务器 5.7.33-0ubuntu0.16.04.1 cpu逻辑核数1
redispool测试
单线程 本地虚拟机测试 Ubuntu 16.04 cpu逻辑核数4
多线程 本地虚拟机测试 Ubuntu 16.04 cpu逻辑核数4
连接池连接设置数量
经验公式
连接数 = ((核心数 * 2) + 有效磁盘数) 按照这个公式,即是说你的服务器 CPU 是 4核 i7 的,那连接池连接数大小应该为 ((4*2)+1)=9
这里只是一个经验公式。还要和线程池数量以及具体业务结合在一起。来自:About Pool Sizing · brettwooldridge/HikariCP Wiki (github.com)(HikariCP 是一个高性能的 JDBC 连接池组件,号称性能最好的后起之秀)
CPU总核数 = 物理CPU个数 * 每颗物理CPU的核数
总逻辑CPU数 = 物理CPU个数 * 每颗物理CPU的核数 * 超线程数
查看CPU信息(型号) [root@AAA ~]# cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c 4 Intel(R) Core(TM) i7-10750H CPU @ 2.60GHz # 查看物理CPU个数 [root@AAA ~]# cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l 2 # 查看每个物理CPU中core的个数(即核数) [root@AAA ~]# cat /proc/cpuinfo| grep "cpu cores"| uniq cpu cores : 2 # 查看逻辑CPU的个数 [root@AAA ~]# cat /proc/cpuinfo| grep "processor"| wc -l 4
IO密集型的任务
如果任务整体上是一个IO密集型的任务。在处理一个请求的过程中(处理一个任务),总共耗时 100+5=105ms,而其中只有5ms是用于计算操作的(消耗cpu),另外的100ms等待io响应,CPU利用 率为5/(100+5)。
使用线程池是为了尽量提高CPU的利用率,减少对CPU资源的浪费,假设以100%的CPU利用率来说,要 达到100%的CPU利用率,对于一个CPU就要设置其利用率的倒数个数的线程数,也即 1/(5/(100+5))=21,4个CPU的话就乘以4。那么算下来的话,就是……84,这个时候线程池要设置84个线程数,然后连接池也是设置为84个连接。
MySQL提示“too many connections“的解决方法
首先登录mysql终端,输入show variables like max_connections,查看最大连接数。
默认连接数量这里只有151,可以根据自己需要修改。比如可以临时设置为1000
set GLOBAL max_connections=1000;
连接数长期生效参考地址:mysql数据库Too many connections - 八戒vs - 博客园 (cnblogs.com) 修改长期生效的方式需要 重启mysql
sudo service mysql restart
Table 'performance_schema.session_variables' doesn't exist
druid连接池
可以研究下druid连接池的设计理念,扩展对连接池的理解。