正则表达式中的替换函数 你要学爬虫就先要弄清楚正则替换是什么东西!

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 感受强大的正则处理能力!

🚀 个人主页 极客小俊
✍🏻 作者简介:web开发者、设计师、技术分享博主
🐋 希望大家多多支持一下, 我们一起进步!😄
🏅 如果文章对你有帮助的话,欢迎评论 💬点赞👍🏻 收藏 📂加关注

logo.png

正则替换函数


说到替换呢 这里我觉得首先要回忆一下字符串的相关替换函数!

str_replace() 在字符串中查找字符,然后替换成想要的字符
str_ireplace() 在字符串中查找字符,然后替换成想要的字符 (不区分大小写)
小提示 str_replace() 函数是全局替换

在字符串中查找数组对应的字符,设为红色

代码如下:

//在字符串中查找数组对应的字符,设为红色

$string='[北京市朝阳区HTTP://www.baidu.com
    天安门北京市朝阳区http://www.sina.com天安门
    北京市朝阳区HTTP://www.163.com天安门]';

$data=[
    'http://www.baidu.com',
    'http://www.sina.com',
    'http://www.163.com'
];

//处理之前
echo nl2br($string);

echo '<hr>';

foreach ({
   
   mathJaxContainer[0]}k=>$v){
   
   
    //这里使用的是不区分大小写的str_ireplace()方法来替换
    {
   
   mathJaxContainer[1]}v, '<span style="color:red;">'.{
   
   mathJaxContainer[2]}string);
}

//处理之后
echo nl2br($string);

str_replace()方法中的参数 有三种使用技巧

第一种:str_replace(string,string,string,替换次数);

代码如下:

$string="online project php hosting user git includes php source-code php browser , 
php in-line editing wikis and ticketing free for public php open-source code!";
$search='php';
$replace='<span style="color:#ff0000;">php</span>';
echo str_replace({
   
   mathJaxContainer[3]}replace, {
   
   mathJaxContainer[4]}count);
echo '<br>';
echo '替换的次数是:'.$count.'次!';

第二种:str_replace(array,string,string,替换次数);

简单粗暴点!

代码如下:

$string="online project 美国 php hosting 日本 user git includes php 韩国 source-code php browser , 
php in-line editing 法国 wikis and ticketing 澳大利亚 free for public php open-source code!";
//查找的数据
$search=array(
    '美国',
    '日本',
    '韩国',
    '法国',
    '澳大利亚'
);
//替换为
$replace='<span style="color:#ff0000;">***</span>';

//开始替换
echo str_replace({
   
   mathJaxContainer[5]}replace, {
   
   mathJaxContainer[6]}count);
echo '<br>';
echo '替换的次数是:'.$count.'次!';

第三种: str_replace(array,array,string,替换次数);

代码如下:

$string="online project 美国 php hosting 日本 user git includes php 韩国 source-code php browser , 
php in-line editing 法国 wikis and ticketing 澳大利亚 free for public php open-source code!";

//查找的数据
$search=array(
    '美国',
    '日本',
    '韩国',
    '法国',
    '澳大利亚'
);

//替换为
$replace=[
    '<span style="color:red;">***</span>',
    '<span style="color:blue;">???</span>',
    '<span style="color:yellow;">###</span>',
    '<span style="color:green;">@@@</span>',
    '<span style="color:#ccc;">&&&</span>',
];

//开始替换
echo str_replace({
   
   mathJaxContainer[7]}replace, {
   
   mathJaxContainer[8]}count);
echo '<br>';
echo '替换的次数是:'.$count.'次!';

以上就是回顾了一下 字符串中的替换,别走开,接下来我们才要进入正则函数替换的正题哦!

PHP正则替换函数

preg_replace()

正则中替换函数、返回值可能是一个字符串也可能是一个数组
preg_replace(参数..)
参数列表:
参数1: $pattern正则字符串 或者 正则数组
参数2: $replacement替换为的字符串 或者 字符串数组
参数3: $string处理的字符串 或者 字符串数组
参数4: 每个模式在每个字符串上进行替换几次数,默认是 -1 全部替换
参数5: 记录替换次数的引用变量

代码案例

$string="online project php hosting  mysql user git includes php  source-code php browser 
php in-line editing  wikis and ticketing  free for public javascript open-source code!";
//查找的数据
$search='/php | mysql | javascript/';
//替换为
$replace='<font color="red">***</font>';
//开始替换
echo preg_replace({
   
   mathJaxContainer[9]}replace,$string);
  1. 使用子模式进行替换 子模式可以用到第二个参数当中

代码案例

$string="online project php hosting  mysql user git includes php  source-code php browser , 
php in-line editing  wikis and ticketing  free for public javascript open-source code!";
//查找的数据
$search='/(php | mysql | javascript)/';
//替换为 这里要记得字符串的单双引号对反向引用的作用哦! 前面提到过 !!不懂的同学可以回去看看!!
$replace="<font color='red'>\\1</font>";
//开始替换
echo preg_replace({
   
   mathJaxContainer[10]}replace,$string);
  1. 在前两个参数中都使用数组,可以一起将多个模式(正则)同时替换对应的多个值
    替换UBB代码, 这里就不介绍UBB是什么了 自己百度一下就会知道简单地一匹
    代码案例图如下:
    $string="online [align=left][b]PHP开发[/b][/align] project [u]php[/u] hosting  mysql user git includes php  source-code php browser , 
php in-line [b]editing[/b]  wikis and ticketing  free for [font size=7]public[/font] javascript open-source code! A better way to work together
[align=center][color color=red]GitHub[/color][/align] brings teams [color color=blue]together[/color] to work through problems, move ideas forward, and learn from each other along the way.
[img width=100]http://localhost/test3/1.jpg[/img]";

//替换之前
echo $string;
echo '<hr>';

//查找的数据
$pattern=array(
    '/\[u\](.+)\[\/u\]/',
    '/\[b\](.+)\[\/b\]/',
    '/\[align=(left|center|right)\](.+)\[\/align\]/',
    '/\[font(\s+)?(size=\d)?\](.+)\[\/font\]/',
    '/\[color(\s+)?color=([a-zA-Z]+)?\](.+?)\[\/color\]/',
    '/\[img\s(width=\d{1,3})?\](.+)\[\/img\]/'
);
//替换为
$replace=array(
    '<u>${1}</u>',
    '<b>${1}</b>',
    '<p align="${1}">${2}</p>',
    '<font ${2}>${3}</font>',
    '<span style="color:${2}">${3}</span>',
    '<img ${1} src="${2}"\>'
);

//开始替换
{
   
   mathJaxContainer[15]}pattern, {
   
   mathJaxContainer[16]}string);
echo $result;
echo '<hr>';

注意:在php7以后preg_replace()函数第一个参数正则中已经不支持e这个模式修正符号、也就是不再支持/e修饰符,如果要使用函数就请用: preg_replace_callback()函数

preg_replace_callback函数

作用: 执行一个正则表达式搜索并且使用一个回调进行替换,匹配到的字符和子组都包含在回调函数的参数当中!
参数列表:
参数1: 正则字符串 或一个数组
参数2: 处理替换的回调函数 支持 普通函数、匿名函数、类方法
参数3: 处理的字符串
参数4: 每个模式在每个字符串上进行替换几次数,默认是 -1 全部替换
参数5: 记录替换次数的引用变量

例1:匿名函数替换

代码案例

$string='Assign up to ten teammates to an issue or pull request to make
sure work has an owner. Mentioning other people or teams mysql
in the issue will notify them if php something changes. javascript
They can also stay in the php loop by opting to receive notifications whenever someone post';
$pattern='/mysql|php|javascript/';
echo preg_replace_callback({
   
   mathJaxContainer[17]}arr){
   
   
    //show($arr);
    echo $num++;
    return '<span style="color:red">'.strtolower($arr[0]).'</span>';
}, $string);

例2:类的方法替换方法
代码案例

$string='Assign up php to ten teammates to an issue or pull request to make
sure work has an owner. Mentioning other people or teams mysql
in the issue will notify them if php something changes. javascript
They can also stay in the php loop by opting to receive notifications whenever someone post';

$pattern=array(
    '/php/i',
    '/javascript/',
    '/mysql/'
);

class Replace{
   
   
    static public function txt($replace) {
   
   
        show($replace);
       if($replace[0]=='php'){
   
   
           return '<span style="color:red">'.$replace[0].'</span>';
       }
      return '<a href="" style="color:blue">'.$replace[0].'</a>';
    }
}

{
   
   mathJaxContainer[18]}pattern, 'Replace::txt', $string);
echo $result;
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6月前
|
机器学习/深度学习 前端开发 Windows
【夯实技术基本功】「底层技术原理体系」全方位带你认识和透彻领悟正则表达式(Regular Expression)的开发手册(正则符号深入解析 )
【夯实技术基本功】「底层技术原理体系」全方位带你认识和透彻领悟正则表达式(Regular Expression)的开发手册(正则符号深入解析 )
77 0
|
JavaScript 前端开发
JS正则表达式:常用正则手册/RegExp/正则积累(一)
JS正则表达式:常用正则手册/RegExp/正则积累
105 1
|
存储 JavaScript 安全
JS正则表达式:常用正则手册/RegExp/正则积累(二)
JS正则表达式:常用正则手册/RegExp/正则积累
90 0
|
5月前
正则表达式(有关String当中,有关正则的方法)
正则表达式(有关String当中,有关正则的方法)
|
Shell Linux Perl
Shell基础学习---3、Read读取控制台输入、函数、正则表达式入门
Shell基础学习---3、Read读取控制台输入、函数、正则表达式入门
Python正则表达式所有函数详解
Python 中的 re.fullmatch() 函数用于检查输入字符串是否完全匹配给定的正则表达式模式。它接受两个参数:第一个是正则表达式模式,第二个是要与该模式匹配的字符串。如果匹配成功,它会返回一个匹配对象,如果匹配失败,则返回 None。
|
6月前
|
Shell Linux Perl
Shell基础学习---3、Read读取控制台输入、函数、综合应用案例:归档文件、正则表达式入门(第二天学习)
Shell基础学习---3、Read读取控制台输入、函数、综合应用案例:归档文件、正则表达式入门
123 1
|
6月前
|
数据采集 JSON 关系型数据库
requests库常用函数使用——爬虫基础(1)
requests库常用函数使用——爬虫基础(1)
89 0
|
6月前
|
Java 计算机视觉
【Java 正则表达式】简单用法,注意点,我学不会正则
【Java 正则表达式】简单用法,注意点,我学不会正则
编程小白的自学笔记四(正则表达式模块search函数)
编程小白的自学笔记四(正则表达式模块search函数)