MySQL 保姆级教程(七):用正则表达式进行搜索

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
云数据库 RDS PostgreSQL,高可用系列 2核4GB
简介: MySQL 保姆级教程(七):用正则表达式进行搜索

第 9 章 用正则表达式进行搜索

9.1 正则表达式介绍

正则表达式是用来匹配文本的特殊的串(字符集合)

9.2 使用 MySQL 正则表达式

MySQL 用WHERE 子句对正则表达式提供了初步的支持,允许你指定正则表达式,过滤 SELECT 检索出的数据

9.2.1 基本字符匹配

输入: SELECT help_category_id,help_category.name FROM help_category WHERE help_category.name LIKE 'MBR';
输出: 
+------------------+------+
| help_category_id | name |
+------------------+------+
|                8 | MBR  |
+------------------+------+
输入: SELECT help_category_id,help_category.name FROM help_category WHERE help_category.name REGEXP 'MBR';
输出: 
+------------------+---------------+
| help_category_id | name          |
+------------------+---------------+
|                8 | MBR           |
|               32 | MBR Functions |
+------------------+---------------+
分析: 
    LIKE: 
        1. 适用于简单的模糊匹配,但功能相对较弱
        2. 在某些情况下,对于简单模式可能比较高效
        3. 使用通配符 % 和 _
    REGEXP: 
        1. 支持更强大的正则表达式,可以实现更复杂的匹配规则
        2. 对于复杂的正则表达式,可能会比 LIKE 更消耗计算资源
        3. 使用正则表达式语法
        
输入: SELECT server_cost.cost_name,server_cost.last_update FROM server_cost WHERE server_cost.cost_name REGEXP '.row';
输出: 
+---------------------------+---------------------+
| cost_name                 | last_update         |
+---------------------------+---------------------+
| disk_temptable_row_cost   | 2024-01-03 15:22:15 |
| memory_temptable_row_cost | 2024-01-03 15:22:15 |
+---------------------------+---------------------+
分析: 这里使用了正则表达式 .row,'.' 是正则表达式中的一个特殊字符,它表示匹配任意字符

9.2.2 进行 OR 匹配

输入: SELECT help_category_id,help_category.name FROM help_category WHERE help_category.name REGEXP 'MBR|XML';
输出: 
+------------------+---------------+
| help_category_id | name          |
+------------------+---------------+
|                8 | MBR           |
|               32 | MBR Functions |
|               17 | XML           |
+------------------+---------------+
分析: 语句中使用了正则表达式 MBR|XML,表示匹配其中之一,因此都匹配返回。以下是 LIKE 的对比
输入: SELECT help_category_id,help_category.name FROM help_category WHERE help_category.name LIKE 'MBR' OR help_category.name LIKE 'XML';
输出: 
+------------------+------+
| help_category_id | name |
+------------------+------+
|                8 | MBR  |
|               17 | XML  |
+------------------+------+

9.2.3 匹配几个字符之一

输入: SELECT server_cost.cost_name,server_cost.last_update FROM server_cost WHERE server_cost.cost_name REGEXP 'e[vmp]'
输出: 
+------------------------------+---------------------+
| cost_name                    | last_update         |
+------------------------------+---------------------+
| disk_temptable_create_cost   | 2024-01-03 15:22:15 |
| disk_temptable_row_cost      | 2024-01-03 15:22:15 |
| memory_temptable_create_cost | 2024-01-03 15:22:15 |
| memory_temptable_row_cost    | 2024-01-03 15:22:15 |
| row_evaluate_cost            | 2024-01-03 15:22:15 |
+------------------------------+---------------------+
分析: 这里使用了正则表达式 'e[vmp]',[vm] 定义一组字符,它的意思是匹配 v 或 m 或 p,因此返回 ev 和 em(没有匹配到 ep)

9.2.4 匹配范围

输入: SELECT help_category_id,help_category.name FROM help_category WHERE help_category_id REGEXP '[1-2]' ORDER BY help_category_id;
输出: 
+------------------+-------------------------------+
| help_category_id | name                          |
+------------------+-------------------------------+
|                1 | Help Metadata                 |
|                2 | Data Types                    |
|               10 | Comparison Operators          |
|               11 | Logical Operators             |
|               12 | Flow Control Functions        |
|               13 | Numeric Functions             |
|               14 | Date and Time Functions       |
|               15 | String Functions              |
|               16 | Cast Functions and Operators  |
|               17 | XML                           |
|               18 | Bit Functions                 |
|               19 | Encryption Functions          |
|               20 | Locking Functions             |
|               21 | Information Functions         |
|               22 | Spatial Functions             |
|               23 | WKT Functions                 |
|               24 | WKB Functions                 |
|               25 | Geometry Constructors         |
|               26 | Geometry Property Functions   |
|               27 | Point Property Functions      |
|               28 | LineString Property Functions |
|               29 | Polygon Property Functions    |
|               31 | Geometry Relation Functions   |
|               32 | MBR Functions                 |
|               41 | Data Manipulation             |
|               42 | Transactions                  |
|               51 | Utility                       |
|               52 | Storage Engines               |
+------------------+-------------------------------+
分析: 这里使用正则表达式 [1-2],定义了一个范围

9.2.5 匹配特殊字符

输入: SELECT database_name,table_name,stat_name FROM innodb_index_stats WHERE stat_name REGEXP '.';
输出: 
+---------------+------------+--------------+
| database_name | table_name | stat_name    |
+---------------+------------+--------------+
| mysql         | component  | n_diff_pfx01 |
| mysql         | component  | n_leaf_pages |
| mysql         | component  | size         |
| sys           | sys_config | n_diff_pfx01 |
| sys           | sys_config | n_leaf_pages |
| sys           | sys_config | size         |
+---------------+------------+--------------+
分析: 因为 . 匹配任意字符,所有每个行逗号被检索出来
输入: SELECT database_name,table_name,stat_name FROM innodb_index_stats WHERE stat_name REGEXP '\\.';
输出: Empty set (0.01 sec)
分析: 为了匹配特殊字符必须使用 \\ 为前导
元字符         说明
\\f           换页
\\n           换行
\\r           回车
\\t           制表
\\v           纵向制表

9.2.6 匹配字符类

类                   说明
[:alnum:]             任意字母和数字
[:alpha:]             任意字符
[:blank:]             空格和制表
[:cntrl:]             ASCII 控制字符
[:digit:]             任意数字
[:graph:]             与 [:print:] 相同,但不包括空格
[:lower:]             任意小写字母
[:print:]             任意可打印字符
[:punct:]             既不在 [:alnum:] 又不在 [:cntrl:] 中的任意字符
[:space:]             包括空格在内的任意空白字符
[:upper:]             任意大写字母
[:xdigit:]            任意十六进制数字
输入: SELECT database_name,table_name,stat_name FROM innodb_index_stats WHERE stat_name REGEXP '[:alnum:]';
输出: 
+---------------+------------+--------------+
| database_name | table_name | stat_name    |
+---------------+------------+--------------+
| mysql         | component  | n_diff_pfx01 |
| mysql         | component  | n_leaf_pages |
| mysql         | component  | size         |
| sys           | sys_config | n_diff_pfx01 |
| sys           | sys_config | n_leaf_pages |
| sys           | sys_config | size         |
+---------------+------------+--------------+

9.2.7 匹配多个实例

元字符         说明
*             0 个或多个匹配
+             1 个或多个匹配
?             0 个或 1 个匹配
{n}           指定数目的匹配
{n,}          不少于指定数目的匹配
{n,m}         匹配数目的范围( m 不超过 255 )
输入: SELECT help_topic_id FROM help_relation WHERE help_topic_id REGEXP '[[:digit:]]{4}' ORDER BY help_topic_id;
输出: Empty set (0.01 sec)
分析: [:digit:] 匹配任意数字,{4} 确切要求它前面的字符出现 4 次,所以连在一起的任意 4 位数字
输入: SELECT help_topic_id,help_topic.name FROM help_topic WHERE help_topic.name REGEXP 'HELP\\_?' ORDER BY help_topic_id;
输出: 
+---------------+----------------+
| help_topic_id | name           |
+---------------+----------------+
|             0 | HELP_DATE      |
|             1 | HELP_VERSION   |
|             3 | HELP COMMAND   |
|           697 | HELP STATEMENT |
+---------------+----------------+
分析: \\ 转义字符 _ , ? 指示前面字符可出现 0 次 或者 1 次 

9.2.8 定位符

元字符         说明
^             文本的开始
$             文本的结尾
[[:<:]]       词的开始
[[:>:]]       词的结尾
输入: SELECT help_category_id,help_category.name FROM help_category WHERE help_category.name REGEXP 'MBR';
输出: 
+------------------+---------------+
| help_category_id | name          |
+------------------+---------------+
|                8 | MBR           |
|               32 | MBR Functions |
+------------------+---------------+
输入: SELECT help_category_id,help_category.name FROM help_category WHERE help_category.name REGEXP '^MBR$';
输出: 
+------------------+------+
| help_category_id | name |
+------------------+------+
|                8 | MBR  |
+------------------+------+
分析: 利用 ^ 开头 $ 结尾定位
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
4月前
|
自然语言处理 搜索推荐 关系型数据库
MySQL实现文档全文搜索,分词匹配多段落重排展示,知识库搜索原理分享
本文介绍了在文档管理系统中实现高效全文搜索的方案。为解决原有ES搜索引擎私有化部署复杂、运维成本高的问题,我们转而使用MySQL实现搜索功能。通过对用户输入预处理、数据库模糊匹配、结果分段与关键字标红等步骤,实现了精准且高效的搜索效果。目前方案适用于中小企业,未来将根据需求优化并可能重新引入专业搜索引擎以提升性能。
212 5
|
2月前
|
存储 关系型数据库 MySQL
【免费动手教程上线】阿里云RDS MySQL推出大容量高性能存储:高性能本地盘(最高16TB存储空间)、高性能云盘(最高64TB存储空间)
阿里云RDS MySQL提供高性能本地盘与高性能云盘等存储方案,满足用户大容量、低延迟需求。高性能本地盘单盘最大16TB,IO延时微秒级;高性能云盘兼容ESSD特性,支持IO性能突发、BPE及16K原子写等能力。此外,阿里云还提供免费动手体验教程,帮助用户直观感受云数据库 RDS 存储性能表现。
|
5月前
|
SQL 关系型数据库 MySQL
MySQL 中的全文索引:强大的文本搜索利器
MySQL 的全文索引是一种用于快速搜索大量文本数据的特殊索引。它通过对文本内容进行分析(如分词、去除停用词等)并构建倒排索引,实现高效查找。创建全文索引使用 `CREATE FULLTEXT INDEX`,搜索时使用 `MATCH AGAINST` 语句。适用于 `CHAR`、`VARCHAR`、`TEXT` 等字段,但需注意性能影响和正确使用搜索语法。
204 22
|
11月前
|
关系型数据库 MySQL Java
centos7安装mysql教程及Navicat平替软件
【8月更文挑战第17天】本教程详述CentOS 7上安装MySQL的过程。首先确保移除任何预装的MySQL组件,然后通过wget获取并安装MySQL的YUM源。可以选择安装特定版本如5.7或8.0。安装MySQL服务器后,启动服务并查找初始密码。登录MySQL后应立即更改密码,并可根据需要设置远程访问权限。此外,还推荐使用免费开源的DBeaver作为数据库管理工具,提供了安装步骤以方便管理和操作MySQL数据库。
340 3
|
7月前
|
NoSQL Java 关系型数据库
Liunx部署java项目Tomcat、Redis、Mysql教程
本文详细介绍了如何在 Linux 服务器上安装和配置 Tomcat、MySQL 和 Redis,并部署 Java 项目。通过这些步骤,您可以搭建一个高效稳定的 Java 应用运行环境。希望本文能为您在实际操作中提供有价值的参考。
428 26
|
8月前
|
关系型数据库 MySQL Java
Servlet+MySQL增删改查 原文出自[易百教程] 转载请保留原文链接: https://www.yiibai.com/geek/1391
对于任何项目开发,创建,读取,更新和删除(CRUD)记录操作是应用程序的一个最重要部分。
188 20
|
9月前
|
tengine 关系型数据库 MySQL
Tengine、Nginx安装MySQL数据库命令教程
本指南详细介绍了在Linux系统上安装与配置MySQL数据库的步骤。首先通过下载并安装MySQL社区版本,接着启动MySQL服务,使用`systemctl start mysqld.service`命令。若启动失败,可尝试使用`sudo /etc/init.d/mysqld start`。利用`systemctl status mysqld.service`检查MySQL的服务状态,确保其处于运行中。通过日志文件获取初始密码,使用该密码登录数据库,并按要求更改初始密码以增强安全性。随后创建一个名为`tengine`的数据库,最后验证数据库创建是否成功以及完成整个设置流程。
|
9月前
|
存储 SQL 关系型数据库
【入门级教程】MySQL:从零开始的数据库之旅
本教程面向零基础用户,采用通俗易懂的语言和丰富的示例,帮助你快速掌握MySQL的基础知识和操作技巧。内容涵盖SQL语言基础(SELECT、INSERT、UPDATE、DELETE等常用语句)、使用索引提高查询效率、存储过程等。适合学生、开发者及数据库爱好者。
247 0
【入门级教程】MySQL:从零开始的数据库之旅
|
12月前
|
关系型数据库 MySQL Linux
Docker安装mysql详细教程, mysqld: Can‘t read dir of ‘/etc/mysql/conf.d/‘(报错已解决)
Docker安装mysql详细教程, mysqld: Can't read dir of '/etc/mysql/conf.d/' (Errcode: 2 - No such file or directory) 已解决
|
11月前
|
SQL 关系型数据库 MySQL
PHP与MySQL交互之基础教程
【8月更文挑战第31天】 在数字世界中,数据是推动一切的核心力量。本文将引导你探索PHP与MySQL的协同工作,通过实际代码示例,展示如何建立连接、执行查询以及处理结果集。无论你是初学者还是希望巩固知识的开发者,这篇文章都将为你提供宝贵的实践知识。

推荐镜像

更多