Linux组件之数据库连接池

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: Linux组件之数据库连接池

一、数据库连接池


1.1 池化技术

手写线程池一文中,我们简单介绍了什么是线程池、为什么需要线程池、以及如何实现线程池。本文介绍的数据库连接池,与线程池一样,也是利用池化技术来避免频繁创建资源对象,从而减小系统开销。


所谓的池化技术,是一种资源管理技术,旨在通过事先分配和复用资源,提高系统的效率和性能。简单来说,就是通过提前建立一些资源对象,使用时获取,用完之后归还。这样能够减少资源对象的创建次数,提高程序的响应性能,特别是在高并发场景。使用池化技术缓存的资源对象有如下共同特点:

1)对象创建时间长

2)对象创建需要大量资源

3)对象创建后可被重复使用

像常见的线程池、内存池、连接池、对象池都具有以上的共同特点。

1.2 数据库连接池及其作用

创建数据库连接是一个很耗时的操作(后面会具体介绍),因此利用池化技术,在应用程序和数据库服务器之间建立一个缓存区,即数据库连接池。在连接池中缓存预先建立好的数据库连接对象。当应用程序需要访问数据库时,可以从连接池中获取一个可用的数据库连接对象进行操作,并在完成操作后将其归还到连接池中。


作用

1)资源复用

避免了频繁的创建、释放连接引起的性能开销,减少系统消耗。另一方面也增进了系统运行环境的平稳性(减少内存碎片以及数据库临时进程/线程的数量)。

2)更快的系统响应速度

数据库连接池在初始化工作完成后,对于业务请求处理而言,直接利用现有可用的连接,避免了从数据库连接初始化和释放过程的开销,从而缩减了系统整体响应时间。

3)统一的连接管理,避免数据库连接泄露

根据预先设定的连接占用超时,强制收回被占用连接,从而避免了常规数据库连接操作中可能出现的资源泄露。


1.3 不使用数据库连接池

前面介绍了数据库连接池的作用,为了更直观点体现优势所在。我们看看如果不使用数据库连接池时,数据库怎么查询。


对于每条 sql 语句,都要执行下面流程

1)TCP建立连接的三次握手(客户端与MySQL服务器的连接基于TCP协议)

2)MySQL认证的三次握手

3)真正的SQL执行

4)MySQL的关闭

5)TCP的四次握手关闭

可以看到,为了执行一条SQL,需要进行TCP三次握手,Mysql认证、Mysql关闭、TCP四次挥手等其他操作,执行SQL操作在所有的操作占比非常低。


这种方式实现简单,不需要设计连接池。但是缺点比较多

1)网络IO较多。

2)带宽利用率低。

3)QPS较低。

4)频繁创建连接和关闭连接,导致临时对象较多,产生更多的内存碎片。

5)关闭连接后出现大量TIME_WAIT的TCP状态。


1.4 使用数据库连接池

如果使用数据库连接池,在第一次访问的时候,需要建立连接。 但是之后的访问,均会复用之前创建的连接,直接执行SQL语句。

4c8576b9f2a1dbfdd8cac34f474cdb0c_1310fdcc043c4bfeaaae967fffbf6cc4.png

这种连接池的设计较为复杂,但是优点多多:

1)降低网络开销。

2)连接复用。减少连接次数。

3)提升性能。避免了频繁的创建连接。

4)没有TIME_WAIT状态问题。


1.5 长连接和连接池

长连接和连接池都是为了优化数据库连接性能而设计的技术.

1)长连接是指客户端与服务器建立一次连接后,可以重复使用该连接来传输多个请求和响应消息。长连接主要解决单个客户端与服务器之间建立、关闭TCP/IP链接所带来的性能问题。

2)数据库连接池则是在应用程序和数据库服务器之间建立一个缓存区,缓存预先建立好的数据库连接。数据库连接池则更关注于解决应用程序与数据库之间频繁创建、关闭网络链接所带来的性能问题。


连接池内的连接,其实就是长连接,连接池的本质是管理长连接。

bfffed5cc95ce55e02b6896bc0cf74bc_929dbe2fa5904965b6b3b4c5512e3cb5.png


1.6 数据库连接池运行机制

1)从连接池获取或创建可用连接;

2)使用完毕,把连接返回给连接池。

3)系统关闭前,断开所有连接并释放连接占用的系统资源。


ed574fa46d690d3d08ccdf72f532bf6c_4eeedbf8ab7f4fd88579c073f898f2c1.png

1.7 连接池和线程池的关系

1)线程池:主动调用任务。当任务队列不为空的时候从队列取任务取执行。

2)连接池:被动被任务使用。当某任务需要操作数据库时,只要从连接池中取出一个连接对象,当任务使用完该连接对象后,将该连接对象放回到连接池中。如果连接池中没有连接对象可以用,那么该任务就必须等待。


连接池和线程池设置数量的关系

1)一般线程池线程数量和连接池连接对象数量一致;

2)线程执行任务完毕的时候归还连接对象;


连接池和线程池在实际应用中往往会一起使用来达到更好的性能优化效果。


二、数据库连接池的设计

连接池的设计思路:

1)连接到数据库,涉及到数据库ip、端口、用户名、密码、数据库名字等;

\quad~ 连接的操作,每个连接对象都是独立的连接通道,它们是独立的

\quad~ 配置最小连接数和最大连接数

2)需要一个队列管理他的连接,比如使用list;

3)获取连接对象:

4)归还连接对象;

5)连接池的名字:不同的业务可以设计不同的连接池,根据名字进行区分。比如对于通讯聊天应用,对于存储聊天记录的msgpool,对于存储用户信息的userpool。

e91d9f4ef47cf3258e9a214ba7f8a052_efbbe39ff59c4dc1b39c7990c00a5935.png


2.1 mysql 连接池

1. 构造函数

b86aa45af78bca0fb9f708726eb70c24_46baafe1254c4d75a05432b5034a96d8.png

CDBPool::CDBPool(const char *pool_name, const char *db_server_ip, uint16_t db_server_port,
         const char *username, const char *password, const char *db_name, int max_conn_cnt)
{
  m_pool_name = pool_name;          // 连接池的名字
  m_db_server_ip = db_server_ip;        // mysql的ip地址
  m_db_server_port = db_server_port;      // mysql的端口号
  m_username = username;            // mysql的用户名
  m_password = password;            // mysql的秘密
  m_db_name = db_name;            // mysql的数据库名称
  m_db_max_conn_cnt = max_conn_cnt;     // 最大连接数量
  m_db_cur_conn_cnt = MIN_DB_CONN_CNT;    // 最小连接数量
}

2. 初始化

f1b24ec30dca806e3e4b57507d8e9325_64cf9583fcc545c2b6b939f932164b73.png

// 连接对象初始化
int CDBConn::Init()
{
  m_mysql = mysql_init(NULL); // mysql_标准的mysql c client对应的api
  if (!m_mysql)
  {
    log_error("mysql_init failed\n");
    return 1;
  }
  int reconnect = 1;
  mysql_options(m_mysql, MYSQL_OPT_RECONNECT, &reconnect);  // 配合mysql_ping实现自动重连
  mysql_options(m_mysql, MYSQL_SET_CHARSET_NAME, "utf8mb4");  // utf8mb4和utf8区别
  // ip 端口 用户名 密码 数据库名
  if (!mysql_real_connect(m_mysql, m_pDBPool->GetDBServerIP(), m_pDBPool->GetUsername(), m_pDBPool->GetPasswrod(),
              m_pDBPool->GetDBName(), m_pDBPool->GetDBServerPort(), NULL, 0))
  {
    log_error("mysql_real_connect failed: %s\n", mysql_error(m_mysql));
    return 2;
  }
  return 0;
}
// 连接池的初始化
int CDBPool::Init()
{
  // 创建固定最小的连接数量
  for (int i = 0; i < m_db_cur_conn_cnt; i++)
  { 
    // 新建连接
    CDBConn *pDBConn = new CDBConn(this);
    // 初始化连接
    int ret = pDBConn->Init();
    if (ret)
    {
      delete pDBConn;
      return ret;
    }
    // 新建立的连接加入容器
    m_free_list.push_back(pDBConn);
  }
  return 0;
}

3. 请求获取连接

453128ef95a4bc3252511408ad9a11aa_7aee5e35b4aa4263b5f3e23137487a3d.png


/*
 *TODO: 增加保护机制,把分配的连接加入另一个队列,这样获取连接时,如果没有空闲连接,
 *TODO: 检查已经分配的连接多久没有返回,如果超过一定时间,则自动收回连接,放在用户忘了调用释放连接的接口
 * timeout_ms默认为 0死等
 * timeout_ms >0 则为等待的时间
 */
CDBConn *CDBPool::GetDBConn(const int timeout_ms)
{ 
  // 加锁
  std::unique_lock<std::mutex> lock(m_mutex);
  // 是否关闭连接池,关闭则不能获取连接
  if(m_abort_request) 
  {
    log_warn("have aboort\n");
    return NULL;
  }
  // 检查连接池池是否有空闲连接
  // 1. 连接池没有空闲连接可以用
  if (m_free_list.empty())    
  { 
    // 检查当前连接数量是否达到最大的连接数量 
    // 1.1 当前连接数 >= 最大连接数,不能创建新的连接
    if (m_db_cur_conn_cnt >= m_db_max_conn_cnt) 
    {
      // 等待的逻辑,看看是否需要超时等待
      // 1.1.1 死等,直到有连接可以用 或者 连接池要退出
      if(timeout_ms <= 0) 
      {
        log_info("wait ms:%d\n", timeout_ms);
        m_cond_var.wait(lock, [this] 
        {
          log_info("wait:%d, size:%lu\n", wait_cout++, m_free_list.size());
          // 当 (m_free_list不为空,等到了空闲连接 )或者 (请求释放连接池),这两种情况时退出
          return (!m_free_list.empty()) | m_abort_request;
        });
      } 
      // 1.1.2 超时等待
      else {
        // return如果返回 false,继续wait(或者超时),  如果返回true退出wait
        // 1.m_free_list不为空
        // 2.超时退出
        // 3. m_abort_request被置为true,要释放整个连接池
        m_cond_var.wait_for(lock, std::chrono::milliseconds(timeout_ms), [this] {
          log_info("wait_for:%d, size:%lu\n", wait_cout++, m_free_list.size());
          return (!m_free_list.empty()) | m_abort_request;
        });
        // 如果超时退出,且连接池还是没有空闲则退出
        if(m_free_list.empty())   
        {
          return NULL;
        }
      }
      // 若连接池要释放,则不能获取资源
      if(m_abort_request) 
      {
        log_warn("have aboort\n");
        return NULL;
      }
    }
    // 1.2 当前连接数 < 最大连接数,创建连接
    else 
    {
      CDBConn *pDBConn = new CDBConn(this); //新建连接
      int ret = pDBConn->Init();
      if (ret)
      {
        log_error("Init DBConnecton failed\n\n");
        delete pDBConn;
        return NULL;
      }
      else
      {
        m_free_list.push_back(pDBConn);
        m_db_cur_conn_cnt++;
      }
    }
  }
  // 2. 连接池有空闲连接可以用
  // 获取连接
  CDBConn *pConn = m_free_list.front(); 
  // 从空闲队列删除
  m_free_list.pop_front();  
  // 加入到已经被请求的连接
  m_used_list.push_back(pConn); 
  return pConn;
}

4. 归还连接

763a9b6e669eab6c182cdcdb0c3c32f9_67d16ed6adb9403d97002fed219ba23a.png


void CDBPool::RelDBConn(CDBConn *pConn)
{ 
  if(!pConn) {
    log_error("pConn is null");
    return;
  }
  std::lock_guard<std::mutex> lock(m_mutex);
  list<CDBConn *>::iterator it = m_free_list.begin();
  // 检测该连接是否已经归还,避免重复归还
  for (; it != m_free_list.end(); it++){
    // 说明这个连接已经归还过
    if (*it == pConn) 
    {
      break;  
    }
  }
  // 还没有归还,插入空闲队列并通知取队列
  if (it == m_free_list.end())
  {
    m_used_list.remove(pConn);
    m_free_list.push_back(pConn);
    m_cond_var.notify_one();    // 通知取队列
  }
  // 已经归还过了
  else 
  {
    log_error("RelDBConn failed\n"); // 不再次回收连接
  }
}

5. 析构连接池

ea813352f09dbdce464dd77f214cd907_de5f24ac533149869f7706bade3dacae.png


CDBPool::~CDBPool()
{
  std::lock_guard<std::mutex> lock(m_mutex);
  // 设置关闭标记
  m_abort_request = true;
  // 通知所有在等待的请求退出
  m_cond_var.notify_all();    
  for (list<CDBConn *>::iterator it = m_free_list.begin(); it != m_free_list.end(); it++)
  {
    CDBConn *pConn = *it;
    delete pConn;
  }
  m_free_list.clear();
}


三、连接池连接数量设置


image.png

# 查看CPU信息(型号) 
cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c
# 查看物理CPU个数 
cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l 
# 查看每个物理cpu核数
cat /proc/cpuinfo| grep "cpu cores"| uniq
# 查看逻辑cpu的个数 
cat /proc/cpuinfo| grep "processor"| wc -l 
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
4月前
|
缓存 监控 Linux
在Linux中,如何进行数据库调优?
在Linux中,如何进行数据库调优?
|
29天前
|
数据库连接 Linux Shell
Linux下ODBC与 南大通用GBase 8s数据库的无缝连接配置指南
本文详细介绍在Linux系统下配置GBase 8s数据库ODBC的过程,涵盖环境变量设置、ODBC配置文件编辑及连接测试等步骤。首先配置数据库环境变量如GBASEDBTDIR、PATH等,接着修改odbcinst.ini和odbc.ini文件,指定驱动路径、数据库名称等信息,最后通过catalog.c工具或isql命令验证ODBC连接是否成功。
|
1月前
|
关系型数据库 MySQL Linux
Linux环境下MySQL数据库自动定时备份实践
数据库备份是确保数据安全的重要措施。在Linux环境下,实现MySQL数据库的自动定时备份可以通过多种方式完成。本文将介绍如何使用`cron`定时任务和`mysqldump`工具来实现MySQL数据库的每日自动备份。
113 3
|
1月前
|
监控 关系型数据库 MySQL
Linux环境下MySQL数据库自动定时备份策略
在Linux环境下,MySQL数据库的自动定时备份是确保数据安全和可靠性的重要措施。通过设置定时任务,我们可以每天自动执行数据库备份,从而减少人为错误和提高数据恢复的效率。本文将详细介绍如何在Linux下实现MySQL数据库的自动定时备份。
51 3
|
1月前
|
关系型数据库 MySQL Linux
Linux系统如何设置自启动服务在MySQL数据库启动后执行?
【10月更文挑战第25天】Linux系统如何设置自启动服务在MySQL数据库启动后执行?
123 3
|
4月前
|
SQL JavaScript 前端开发
vue中使用分页组件、将从数据库中查询出来的数据分页展示(前后端分离SpringBoot+Vue)
这篇文章详细介绍了如何在Vue.js中使用分页组件展示从数据库查询出来的数据,包括前端Vue页面的表格和分页组件代码,以及后端SpringBoot的控制层和SQL查询语句。
vue中使用分页组件、将从数据库中查询出来的数据分页展示(前后端分离SpringBoot+Vue)
|
4月前
|
关系型数据库 Java Linux
在Linux中,有哪些基本组件?
在Linux中,有哪些基本组件?
|
4月前
|
关系型数据库 MySQL Linux
在Linux中,如何配置数据库服务器(如MySQL或PostgreSQL)?
在Linux中,如何配置数据库服务器(如MySQL或PostgreSQL)?
|
4月前
|
SQL 关系型数据库 MySQL
在Linux中,如何备份和恢复MySQL数据库?
在Linux中,如何备份和恢复MySQL数据库?
|
4月前
|
Linux
Linux源码阅读笔记13-进程通信组件中
Linux源码阅读笔记13-进程通信组件中