如何减少频繁创建数据库连接的性能损耗?

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 为极速开发出一套某垂直领域电商系统,采用最简架构:前端一台Web服务器运行业务代码后端一台DB服务器存储业务数据

为极速开发出一套某垂直领域电商系统,采用最简架构:


前端一台Web服务器运行业务代码

后端一台DB服务器存储业务数据

16.png

大多系统初生时就是这样,只是随业务不但发展变得复杂,架构迭代。系统上线后,虽用户量不大,但运行一切正常。不过领导觉得用户量太少,紧急调动运营做了某音的推广。带来大波流量,系统访问速度突然开始变慢。


分析日志后发现系统慢原因出在于和DB交互。目前DB调用方式:


先获取DB连接

通过该连接从DB查数据

关闭连接

释放DB资源

这就导致每次执行SQL都需重建连接,怀疑因频繁建立DB连接耗时过长,导致访问慢。为何频繁创建连接会造成响应时间慢?


做个测试:


tcpdump -i bond0 -nn -tttt port 4490


抓取线上MySQL建立连接的网络包。观察抓包结果


MySQL连接过程

分为如下部分:


前三个数据包

第一个数据包是C向S发送的“SYN”包

第二个包是S回给C的“ACK”包以及一个“SYN”包

第三个包是C回给S的“ACK”包

即TCP三次握手。


MySQL服务端校验客户端密码的过程

第一个包是S发给C要求认证的报文

第二和第三个包是C将加密后的密码发送给S的包,最后两个包是S回给C认证OK的报文。

整个连接过程4ms(969012-964904)。

15.png

单条SQL执行时间多少?

统计一段时间的SQL执行时间,发现SQL平均执行时间1ms,相比SQL执行,MySQL建立连接过程较耗时。

在请求量小时影响不大,因无论建立连接 or 执行SQL,耗时都ms级。但请求量很大,若仍建一次连接只执行一条SQL,1s只能执行200次DB查询,而DB建立连接时间就占4/5。


咋优化?

只需使用连接池将DB连接预先建立好,使用时,就无需频繁创建连接。调整后发现1s即可执行1000次DB查询,查询性能大大提升!


用连接池预先建立DB连接

很多连接池,


如DB连接池、HTTP连接池、Redis连接池。连接池的核心技术就是连接池管理。

DB连接池有两个关键配置:最小连接数和最大连接数,控制从连接池中获取连接的流程。若:


当前连接数<最小连接数

则创建新连接处理DB请求

连接池中有空闲连接

则复用空闲连接

空闲池中无连接 && 当前连接数<最大连接数

则创建新连接去处理请求

当前连接数≥最大连接数

则按配置中设定的时间(C3P0的连接池配置checkoutTimeout)等待旧连接可用

等待超过设定时间

则向用户抛出错误

某按摩店,共10台按摩椅(类比最大连接数),为节省成本(按摩椅很费电),平时会保持店里开着4台按摩椅(最小连接数),其他6台关着。有顾客来时:


若平时保持启动的4台按摩椅有空

直接请他去空闲那台

4台按摩椅都不空

就新启一台,直到10台按摩椅都被用完

10台按摩椅都被用完后咋办?告诉用户,等会儿,大约5分钟(等待时间)内能空出来,然后第11位用户就开等。这就有两个结果,若:


5min内有空

顾客直接去空出的那台

5min都没空

得赔礼道歉,顾客有很急,只能让他去其他店看看

DB连接池线上推荐:


最小连接数 10

最大连接数 20~30

连接的维护问题。有的按摩椅虽然开着,但有时会故障,数据库一般故障原因:


DB域名对应IP变更,池子的连接还是使用旧IP,当旧IP下的DB服务关闭后,再使用该连接查询就会报错

MySQL wait_timeout参数,控制当DB连接闲置多久后,DB会主动关闭该连接。该机制对DB使用方无感知,所以使用这个被关闭的连接时就会报错

怎么保证启动着的按摩椅一定可用?

启动一个线程,定期检测连接池中的连接是否可用。如使用连接发送“select 1”命令给DB查看是否会抛异常,若抛则将该连接从池移除,并尝试关闭。C3P0连接池可这样检测连接是否可用,推荐!

获取到连接后,先校验连接是否可用,若可用才执行SQL。比如DBCP连接池的testOnBorrow配置项,就是控制是否开启该验证

该方案在获取连接时会引入多余开销,线上尽量关闭,测试环境可用用。

总算搞清连接池工作原理。发现某重要接口,需访问3次DB,这日后很可能成为系统瓶颈。应该可创建多线程并行处理与DB交互,速度就能快了。不过高并发阶段,频繁创建线程开销很大,于是想到使用线程池。


线程池预创线程

JDK1.5的ThreadPoolExecutor,类似连接池,重要参数:


corePoolSize

maximumPoolSize

JDK线程池会优先把任务放入队列暂存,而非创建更多线程,适于执行CPU密集型任务,why?

因为执行CPU密集型任务时CPU繁忙,因此只需创建和CPU核数的线程,多了反而导致频繁线程上下文切换,降低任务执行效率。

所以当 当前线程数>核心线程数,线程池不会增加线程,而是放在队列里等待核心线程空闲。


Web系统一般大量I/O操作,如查DB、缓存。任务执行I/O操作时,CPU就空闲,这时若增加执行任务的线程数而不是把任务暂存队列,就能在单位时间执行更多任务,大大提高任务执行吞吐量。所以Tomcat线程池就改造JDK原生线程池,当

线程数>corePoolSize


优先创建线程,直到线程数到达maximumPoolSize,这就适于Web系统大量I/O操作场景。


线程池中使用的队列堆积量也是需监控的重要指标,对实时性要求较高的任务,该指标很关键。曾遇到过任务被丢给线程池后,长时间都未被执行。当时以为代码Bug,后排查发现是因为线程池的coreThreadCount和maxThreadCount设置较小,导致任务在线程池大量堆积,调大这两参数后问题解决。后来就把重要线程池的队列任务堆积量,作为重要监控指标。


使用线程池,不要使用无界队列,也许你觉得使用无界队列,任务永远不会被丢弃,只要任务对实时性要求不高,反正早晚消费完。但大量任务堆积会占用大量内存,一旦内存空间被占满就会频繁地触发Full GC,造成服务不可用!


综上,所管理的对象,无论是连接还是线程,创建过程都很耗时,也很耗系统资源。所以,我们把它们放在一个池子统一管理,以提升性能和资源复用。


这是一种常见的软件设计思想:


池化技术

即空间换时间,期望使用预先创建好的对象来减少频繁创建对象的性能开销,同时还可以对对象进行统一的管理,降低对象的使用成本。


缺陷

存储池子中的对象要消耗多余内存,如对象没有被频繁使用,就造成内存浪费

池子中的对象要在系统启动时就预创建完成,一定程度增加系统启动时间

缺陷相比优势瑕不掩瑜,只要我们确认要使用的对象在创建时确实较耗时或消耗资源,并且这些对象也确实会被频繁创建和销毁,就可使用池化优化。


总结

池子的最大值、最小值设置很重要,初期可依据经验设置,后面还是需要根据实际运行情况调整。

池子中的对象需在使用前预先初始化完成,即预热,如使用线程池时,就要预初始化所有核心线程。若池子未经预热,可能导致系统重启后产生较多慢请求。


池化技术核心是一种空间换时间优化方法的实践,所以要关注空间占用情况,避免出现空间过度使用出现内存泄露或频繁GC。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
10天前
|
XML Java 数据库连接
性能提升秘籍:如何高效使用Java连接池管理数据库连接
在Java应用中,数据库连接管理至关重要。随着访问量增加,频繁创建和关闭连接会影响性能。为此,Java连接池技术应运而生,如HikariCP。本文通过代码示例介绍如何引入HikariCP依赖、配置连接池参数及使用连接池高效管理数据库连接,提升系统性能。
38 5
|
1月前
|
存储 缓存 监控
数据库优化技术:提升性能与效率的关键策略
【10月更文挑战第15天】数据库优化技术:提升性能与效率的关键策略
56 8
|
26天前
|
关系型数据库 MySQL 数据库连接
python脚本:连接数据库,检查直播流是否可用
【10月更文挑战第13天】本脚本使用 `mysql-connector-python` 连接MySQL数据库,检查 `live_streams` 表中每个直播流URL的可用性。通过 `requests` 库发送HTTP请求,输出每个URL的检查结果。需安装 `mysql-connector-python` 和 `requests` 库,并配置数据库连接参数。
125 68
|
20天前
|
缓存 监控 关系型数据库
如何根据监控结果调整 MySQL 数据库的参数以提高性能?
【10月更文挑战第28天】根据MySQL数据库的监控结果来调整参数以提高性能,需要综合考虑多个方面的因素
59 1
|
20天前
|
监控 关系型数据库 MySQL
如何监控和诊断 MySQL 数据库的性能问题?
【10月更文挑战第28天】监控和诊断MySQL数据库的性能问题是确保数据库高效稳定运行的关键
39 1
|
20天前
|
缓存 关系型数据库 MySQL
如何优化 MySQL 数据库的性能?
【10月更文挑战第28天】
43 1
|
22天前
|
SQL Java 数据库连接
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率。本文介绍了连接池的工作原理、优势及实现方法,并提供了HikariCP的示例代码。
37 3
|
21天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
104 1
|
29天前
|
关系型数据库 MySQL 数据库连接
DBeaver如何连接一个数据库
【10月更文挑战第27天】DBeaver 是一款功能强大的通用数据库管理工具,支持多种主流数据库。本文介绍了使用 DBeaver 连接数据库的基本步骤,包括下载安装、创建新连接、选择数据库类型、配置连接参数、测试连接以及最终连接到数据库。详细的操作指南帮助用户轻松管理和操作数据库。
156 9
|
24天前
|
Java 数据库连接 数据库
优化之路:Java连接池技术助力数据库性能飞跃
在Java应用开发中,数据库操作常成为性能瓶颈。频繁的数据库连接建立和断开增加了系统开销,导致性能下降。本文通过问题解答形式,深入探讨Java连接池技术如何通过复用数据库连接,显著减少连接开销,提升系统性能。文章详细介绍了连接池的优势、选择标准、使用方法及优化策略,帮助开发者实现数据库性能的飞跃。
27 4