谈谈正则表达式

简介: 正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。

正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。


嗯~那就是:


  • 正则表达式描述规则


  • 正则表达式作用于字符串


本博文仅仅是自己阅读的笔记...


基础语法的东西,记住下相关的英文就比较好理解了,比如: digit指的是数字[0-9],转换为正则关键字为\d,而其大写\D则表示非digit,即非[0-9]。


^和[^regex]


^这个是放在规则的前面,表示是匹配的开头。[^regex]也就是逻辑非。


console.log((/^I am/).test('I am a teacher.')); // true
复制代码


console.log((/[^\d]/).test('aa')); // true
复制代码


[\b]和\b


[\b]表示的是回退符backspace;而\b表示的是单词边界border


let str = 'teacher\b';
console.log(/[\b]/.test(str)); // true
复制代码


let str = 'I am a teacher.'
console.log(str.replace(/\bam\b/, 'am not')); // 'I am not a teacher'
复制代码


let str = 'Mike is a teacher. And Mike love this job!'
let pattern = /\bmike\b/gi;
console.log(str.replace(pattern, 'Jay')); // 'Jay is a teacher. And Jay love this job!'
复制代码


集合区间[]


集合的区间是使用中括号[]。上面说的[\b]是回退符可以特殊对待。


console.log(/[a-z]/.test('bb')); // true
console.log(/[a-z]/.test('BB')); // false
复制代码


分组()


所有以()元字符所包含的正则表达式被分为一组,每一个分组都是一个子表达式


分组分类型有捕获型()非捕获型(?:)正向前瞻型(?=)反向前瞻型(?!)等。


  • 捕获型(pattern)


匹配结果会存储在缓冲区内供以后使用。


let dateStr = '2019/07/16';
let reg = /(\d{4})\/(\d{2})\/(\d{2})/;
dateStr = dateStr.replace(reg, '$1-$2-$3');
console.log(dateStr); // "2019-07-16"
复制代码


  • 非捕获型(?:pattern)


pattern部分组合成一个可统一操作的组合项,但不把这部分内容作为子匹配捕获,匹配的内容部进行编号也不存储在缓冲区中供以后使用。非捕获性分组方法在必须进行组合、但又不想对组合的部分进行缓存的情况下非常有用。


例如在一篇文章中找programproject两个单词,正则表达式可以表示为/program|project/,也可以表示为/pro(gram|ject)/,但是缓存子匹配(gramject)没有意义,就可以用/pro(?:gram|ject)/进行非捕获性匹配这样既可以简洁匹配又可不缓存无实际意义的字匹配。


let dateStr = '2019/07/16';
let reg = /(?:\d{4})\/(\d{2})\/(\d{2})/;
dateStr = dateStr.replace(reg, '$1-$2-$3');
console.log(dateStr); // "07-16-$3"
console.log(RegExp.$3); // ''
复制代码


  • 正向前瞻型(?=pattern)


在目标字符串的相应位置必须有pattern部分匹配的内容,但不作为匹配结果处理,更不会存储在缓冲区内供以后使用。


比较好的说明:你站在原地往前看,如果前方是指定的东西就返回true,否则为false


let str = 'I am a teacher';
let pattern = /I am a (?=teacher)/
console.log(pattern.test(str)); // true
console.log(RegExp.$1); // ''
复制代码


  • 反向前瞻型(?!pattern)


比较好的说明:你站在原地往前看,如果前方不是指定的东西就返回true,否则为false


let str = 'I am a teacher';
let pattern = /I am a (?!teacher)/
console.log(pattern.test(str)); // false
console.log(RegExp.$1); // ''
复制代码


引用$1,$2...


上面中分组已经说到,对一个正则表达式模式或部分模式两边添加圆括号将导致这部分表达式存储到一个临时缓冲区中。可以使用非捕获元字符 ?:, ?=, 或者 ?! 来忽略对这部分正则表达式的保存。


所捕获的每个子匹配都按照在正则表达式模式中从左至右所遇到的内容存储。存储子匹配的缓冲区编号从1开始,连续编号直至最大99个子表达式。


你可以使用$1, $2...进行逐个的匹配访问,比如:


let dateStr = '2019/07/16';
let reg = /(\d{4})\/(\d{2})\/(\d{2})/;
reg.test(dateStr);
console.log(RegExp.$1); // 2019
console.log(RegExp.$2); // 07
console.log(RegExp.$3); // 16



相关文章
|
5天前
|
数据采集 人工智能 自然语言处理
3分钟采集134篇AI文章!深度解析如何通过云无影AgentBay实现25倍并发 + LlamaIndex智能推荐
结合阿里云无影 AgentBay 云端并发采集与 LlamaIndex 智能分析,3分钟高效抓取134篇 AI Agent 文章,实现 AI 推荐、智能问答与知识沉淀,打造从数据获取到价值提炼的完整闭环。
390 93
|
6天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
5天前
|
SQL 人工智能 自然语言处理
Geo优化SOP标准化:于磊老师的“人性化Geo”体系如何助力企业获客提效46%
随着生成式AI的普及,Geo优化(Generative Engine Optimization)已成为企业获客的新战场。然而,缺乏标准化流程(Geo优化sop)导致优化效果参差不齐。本文将深入探讨Geo专家于磊老师提出的“人性化Geo”优化体系,并展示Geo优化sop标准化如何帮助企业实现获客效率提升46%的惊人效果,为企业在AI时代构建稳定的流量护城河。
394 156
Geo优化SOP标准化:于磊老师的“人性化Geo”体系如何助力企业获客提效46%
|
5天前
|
数据采集 缓存 数据可视化
Android 无侵入式数据采集:从手动埋点到字节码插桩的演进之路
本文深入探讨Android无侵入式埋点技术,通过AOP与字节码插桩(如ASM)实现数据采集自动化,彻底解耦业务代码与埋点逻辑。涵盖页面浏览、点击事件自动追踪及注解驱动的半自动化方案,提升数据质量与研发效率,助力团队迈向高效、稳定的智能化埋点体系。(238字)
278 158
|
13天前
|
机器人 API 调度
基于 DMS Dify+Notebook+Airflow 实现 Agent 的一站式开发
本文提出“DMS Dify + Notebook + Airflow”三位一体架构,解决 Dify 在代码执行与定时调度上的局限。通过 Notebook 扩展 Python 环境,Airflow实现任务调度,构建可扩展、可运维的企业级智能 Agent 系统,提升大模型应用的工程化能力。