牛逼哄哄的数据库连接池,底层原理是个啥?

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
简介: 这次我们采取技术演进的方式来谈谈数据库连接池的技术出现过程及其原理,以及当下最流行的开源数据库连接池jar包。

这次我们采取技术演进的方式来谈谈数据库连接池的技术出现过程及其原理,以及当下最流行的开源数据库连接池jar包。


一、早期我们怎么进行数据库操作


image.png

1、原理


一般来说,Java应用程序访问数据库的过程是:


①装载数据库驱动程序;


②通过jdbc建立数据库连接;


③访问数据库,执行sql语句;


④断开数据库连接。


2、代码

Public void FindAllUsers(){
  //1、装载sqlserver驱动对象
  DriverManager.registerDriver(new SQLServerDriver());
  //2、通过JDBC建立数据库连接
  Connection con =DriverManager.getConnection("jdbc:sqlserver://192.168.2.6:1433;DatabaseName=customer", "sa", "123");
  //3、创建状态
  Statement state =con.createStatement();
  //4、查询数据库并返回结果
  ResultSet result =state.executeQuery("select * from users");
  //5、输出查询结果
  while(result.next()){
     System.out.println(result.getString("email"));
  }
  //6、断开数据库连接
  result.close();
  state.close();
  con.close();
}

3、分析


程序开发过程中,存在很多问题:首先,每一次web请求都要建立一次数据库连接。


建立连接是一个费时的活动,每次都得花费0.05s~1s的时间,而且系统还要分配内存资源。这个时间对于一次或几次数据库操作,或许感觉不出系统有多大的开销。


可是对于现在的web应用,尤其是大型电子商务网站,同时有几百人甚至几千人在线是很正常的事。在这种情况下,频繁的进行数据库连接操作势必占用很多的系统资源,网站的响应速度必定下降,严重的甚至会造成服务器的崩溃。


不是危言耸听,这就是制约某些电子商务网站发展的技术瓶颈问题。其次,对于每一次数据库连接,使用完后都得断开。否则,如果程序出现异常而未能关闭,将会导致数据库系统中的内存泄漏,最终将不得不重启数据库。


还有,这种开发不能控制被创建的连接对象数,系统资源会被毫无顾及的分配出去,如连接过多,也可能导致内存泄漏,服务器崩溃。


上述的用户查询案例,如果同时有1000人访问,就会不断的有数据库连接、断开操作:

image.png

通过上面的分析,我们可以看出来,“数据库连接”是一种稀缺的资源,为了保障网站的正常使用,应该对其进行妥善管理。

其实我们查询完数据库后,如果不关闭连接,而是暂时存放起来,当别人使用时,把这个连接给他们使用。就避免了一次建立数据库连接和断开的操作时间消耗。

原理如下:

image.png

二、技术演进出来的数据库连接池

由上面的分析可以看出,问题的根源就在于对数据库连接资源的低效管理。我们知道,对于共享资源,有一个很著名的设计模式:资源池(resource pool)。


该模式正是为了解决资源的频繁分配﹑释放所造成的问题。为解决上述问题,可以采用数据库连接池技术。


数据库连接池的基本思想就是为数据库连接建立一个“缓冲池”。预先在缓冲池中放入一定数量的连接,当需要建立数据库连接时,只需从“缓冲池”中取出一个,使用完毕之后再放回去。


我们可以通过设定连接池最大连接数来防止系统无尽的与数据库连接。更为重要的是我们可以通过连接池的管理机制监视数据库的连接的数量﹑使用情况,为系统开发﹑测试及性能调整提供依据。


我们自己尝试开发一个连接池,来为上面的查询业务提供数据库连接服务:


① 编写class 实现DataSource 接口


② 在class构造器一次性创建10个连接,将连接保存LinkedList中


③ 实现getConnection 从 LinkedList中返回一个连接


④ 提供将连接放回连接池中方法


1、连接池代码

public class MyDataSource implements DataSource {
  //链表 --- 实现栈结构
  privateLinkedList<Connection> dataSources = new LinkedList<Connection>();
  //初始化连接数量
  publicMyDataSource() {
     //一次性创建10个连接
     for(int i = 0; i < 10; i++) {
        try {
           //1、装载sqlserver驱动对象
           DriverManager.registerDriver(new SQLServerDriver());
           //2、通过JDBC建立数据库连接
           Connection con =DriverManager.getConnection(
            "jdbc:sqlserver://192.168.2.6:1433;DatabaseName=customer", "sa", "123");
           //3、将连接加入连接池中
           dataSources.add(con);
        } catch (Exception e) {
           e.printStackTrace();
        }
     }
  }
  @Override
  publicConnection getConnection() throws SQLException {
     //取出连接池中一个连接
     finalConnection conn = dataSources.removeFirst(); // 删除第一个连接返回
     returnconn;
  }
  //将连接放回连接池
  publicvoid releaseConnection(Connection conn) {
     dataSources.add(conn);
  }
}

2、使用连接池重构我们的用户查询函数

//查询所有用户
public void FindAllUsers(){
  //1、使用连接池建立数据库连接
  MyDataSource dataSource = new MyDataSource();
  Connection conn =dataSource.getConnection();
  //2、创建状态
  Statement state =con.createStatement();
  //3、查询数据库并返回结果
  ResultSet result =state.executeQuery("select * from users");
  //4、输出查询结果
  while(result.next()){
     System.out.println(result.getString("email"));
  }
  //5、断开数据库连接
  result.close();
  state.close();
  //6、归还数据库连接给连接池
  dataSource.releaseConnection(conn);
}

是数据库连接池的原理,它大大提供了数据库连接的利用率,减小了内存吞吐的开销。


我们在开发过程中,就不需要再关心数据库连接的问题,自然有数据库连接池帮助我们处理,这回放心了吧。但连接池需要考虑的问题不仅仅如此,下面我们就看看还有哪些问题需要考虑。


三、连接池还要考虑更多的问题

1、并发问题


为了使连接管理服务具有最大的通用性,必须考虑多线程环境,即并发问题。这个问题相对比较好解决,因为java语言自身提供了对并发管理的支持,使用synchronized关键字即可确保线程是同步的。Synchronized 有几种用法?这也是面试常考的。使用方法为直接在类方法前面加上synchronized关键字,如:

public synchronized connection getconnection()

2、多数据库服务器和多用户


对于大型的企业级应用,常常需要同时连接不同的数据库(如连接oracle和sybase)。如何连接不同的数据库呢?


我们采用的策略是:设计一个符合单例模式的连接池管理类,在连接池管理类的唯一实例被创建时读取一个资源文件,其中资源文件中存放着多个数据库的url地址等信息。


根据资源文件提供的信息,创建多个连接池类的实例,每一个实例都是一个特定数据库的连接池。连接池管理类实例为每个连接池实例取一个名字,通过不同的名字来管理不同的连接池。


对于同一个数据库有多个用户使用不同的名称和密码访问的情况,也可以通过资源文件处理,即在资源文件中设置多个具有相同url地址,但具有不同用户名和密码的数据库连接信息。


3、事务处理


我们知道,事务具有原子性,此时要求对数据库的操作符合“all-all-nothing”原则即对于一组sql语句要么全做,要么全不做。分布式事务不理解?一次给你讲清楚。


在java语言中,connection类本身提供了对事务的支持,可以通过设置connection的autocommit属性为false 然后显式的调用commit或rollback方法来实现。


但要高效的进行connection复用,就必须提供相应的事务支持机制。可采用每一个事务独占一个连接来实现,这种方法可以大大降低事务管理的复杂性。


关注微信公众号:Java技术栈,在后台回复:java,可以获取我整理的 N 篇最新Java 技术教程,都是干货。


4、连接池的分配与释放


连接池的分配与释放,对系统的性能有很大的影响。合理的分配与释放,可以提高连接的复用度,从而降低建立新连接的开销,同时还可以加快用户的访问速度。


对于连接的管理可使用空闲池。即把已经创建但尚未分配出去的连接按创建时间存放到一个空闲池中。


每当用户请求一个连接时,系统首先检查空闲池内有没有空闲连接。


如果有就把建立时间最长(通过容器的顺序存放实现)的那个连接分配给他(实际是先做连接是否有效的判断,如果可用就分配给用户,如不可用就把这个连接从空闲池删掉,重新检测空闲池是否还有连接)。


如果没有则检查当前所开连接池是否达到连接池所允许的最大连接数(maxconn)如果没有达到,就新建一个连接,如果已经达到,就等待一定的时间(timeout)。


如果在等待的时间内有连接被释放出来就可以把这个连接分配给等待的用户,如果等待时间超过预定时间timeout 则返回空值(null)。


系统对已经分配出去正在使用的连接只做计数,当使用完后再返还给空闲池。对于空闲连接的状态,可开辟专门的线程定时检测,这样会花费一定的系统开销,但可以保证较快的响应速度。也可采取不开辟专门线程,只是在分配前检测的方法。


5、连接池的配置与维护


连接池中到底应该放置多少连接,才能使系统的性能最佳?系统可采取设置最小连接数(minconn)和最大连接数(maxconn)来控制连接池中的连接。最小连接数是系统启动时连接池所创建的连接数。Druid 目前最好的连接池,这个推荐给大家。


如果创建过多,则系统启动就慢,但创建后系统的响应速度会很快;如果创建过少,则系统启动的很快,响应起来却慢。


这样,可以在开发时,设置较小的最小连接数,开发起来会快,而在系统实际使用时设置较大的,因为这样对访问客户来说速度会快些。最大连接数是连接池中允许连接的最大数目,具体设置多少,要看系统的访问量,可通过反复测试,找到最佳点。


如何确保连接池中的最小连接数呢?有动态和静态两种策略。动态即每隔一定时间就对连接池进行检测,如果发现连接数量小于最小连接数,则补充相应数量的新连接以保证连接池的正常运转。静态是发现空闲连接不够时再去检查。


四、实际开发中有成熟的开源连接池供我们使用

理解了连接池的原理就可以了,没有必要什么都从头写一遍,那样会花费很多时间,并且性能及稳定性也不一定满足要求。


事实上,已经存在很多流行的性能优良的第三方数据库连接池jar包供我们使用。如:


Apache commons-dbcp


c3p0


Druid


HikariCP


其中c3p0已经很久没有更新了。


DBCP更新速度很慢,基本处于不活跃状态,而Druid和HikariCP处于活跃状态的更新中。

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
相关文章
|
4月前
|
存储 关系型数据库 MySQL
MySQL数据库进阶第六篇(InnoDB引擎架构,事务原理,MVCC)
MySQL数据库进阶第六篇(InnoDB引擎架构,事务原理,MVCC)
|
2月前
|
消息中间件 Kafka 数据库
深入理解Kafka的数据一致性原理及其与传统数据库的对比
【8月更文挑战第24天】在分布式系统中,确保数据一致性至关重要。传统数据库利用ACID原则保障事务完整性;相比之下,Kafka作为高性能消息队列,采用副本机制与日志结构确保数据一致性。通过同步所有副本上的数据、维护消息顺序以及支持生产者的幂等性操作,Kafka在不牺牲性能的前提下实现了高可用性和数据可靠性。这些特性使Kafka成为处理大规模数据流的理想工具。
47 6
|
3月前
|
存储 SQL 关系型数据库
(六)MySQL索引原理篇:深入数据库底层揭开索引机制的神秘面纱!
《索引原理篇》它现在终于来了!但对于索引原理及底层实现,相信大家多多少少都有了解过,毕竟这也是面试过程中出现次数较为频繁的一个技术点。在本文中就来一窥`MySQL`索引底层的神秘面纱!
237 5
|
3月前
|
SQL 存储 安全
SQL数据库:核心原理、应用实践与未来展望
在电子商务领域,SQL数据库用于存储商品信息、用户信息、订单信息等。通过SQL数据库,电商平台可以实现商品的快速检索、用户行为的跟踪分析、订单状态的实时更新等功能,提升用户体验和运营效率。
|
2月前
|
存储 NoSQL 关系型数据库
Web中的数据库:原理、应用与代码实现
Web中的数据库:原理、应用与代码实现
|
4月前
|
SQL 存储 关系型数据库
数据库的基本原理
数据库的基本原理
41 2
|
4月前
|
SQL 存储 多模数据库
数据库技术探索:原理、应用与未来发展趋势
一、引言 数据库技术作为信息时代的基石,已经深入到社会的各个角落
|
4月前
|
存储 SQL Cloud Native
数据库技术揭秘:核心原理与前沿实践
一、引言 数据库技术是信息化时代的基石,它为我们提供了一种高效、可靠的方式来存储、检索和管理数据
|
3月前
|
SQL Java 关系型数据库
Java面试题:描述JDBC的工作原理,包括连接数据库、执行SQL语句等步骤。
Java面试题:描述JDBC的工作原理,包括连接数据库、执行SQL语句等步骤。
52 0
|
3月前
|
SQL 存储 搜索推荐
SQL游标的原理与在数据库操作中的应用
SQL游标的原理与在数据库操作中的应用
下一篇
无影云桌面