【21天python打卡】第10天 网络python(1)

简介: ​大家好,今天是21天python打卡的第10天,上一篇讲了python的源码打包和网络编程。今天说说正则表达式。

Python 正则表达式是什么

学习 Python 正则表达式离不开 re 模块,所以本篇博客会配合 re 模块进行编写。


re 库是 Python 中处理正则表达式的标准库,本篇博客介绍 re 库的同时,会简单介绍一下正则表达式语法,

如果想深入学习正则表达式,还需要好好下一番功夫。


怎么用

正则表达式语法

正则表达式语法由字符和操作符构成,初期阶段掌握下述这些内容即可。

1685621280927.png

以上表示仅仅为正则表达最基础部分内容,如果希望深入研究正则表达式,建议寻找更加全面的资料进行学习,本文只做药引。


re 库基本用法

re 库主要函数如下:

  • 基础函数:compile
  • 功能函数:searchmatchfindallsplitfinditersub


在正式学习之前,先了解一下原生字符串。


在 Python 中,表示原生字符串,需要在字符串前面加上 r。

例如 my_str = 'i'am xiangpica' 在程序中会直接报错,

如果希望字符串中 ' 可以正常运行,需要加上转移字符 \,修改为 my_str = 'i\'am xiangpica'。

但这样结合上文正则表达式中的操作符,就会出现问题,因为 \ 在正则表达式中是有真实含义的,

如果你使用 re 库去匹配字符串中的 \,那需要使用 4 个反斜杠,为了避免这种情况出现,引入了原生字符串概念。

# 不使用原生字符串的正则表达式  "\\\\"
# 使用原生字符串的正则表达式 r"\\"

在后文会有实际的应用。

接下来在学习一个案例,例如下述代码:

1. my_str='C:\number'
2. 
3. print(my_str)


C:
umber

本段代码的输出效果如下,\n 被解析成了换行,如果想要屏蔽这种现象,使用 r 即可:

1. my_str=r'C:\number'
2. 
3. print(my_str)


输出 C:\number


re.search 函数

该函数用于,在字符串中搜索正则表达式匹配到的第一个位置的值,返回 match 对象。

函数原型如下:

re.search(pattern,string,flags=0)

需求:在字符串 梦想橡皮擦 good good 中匹配 橡皮擦

import re
my_str='good good'
pattern = r' '
ret = re.search(pattern,my_str)
print(ret)

返回结果:<re.Match object; span=(2, 5), match=''>。


search 函数的第三个参数 flags 表示正则表达式使用时的控制标记。


re.I,re.IGNORECASE:忽略正则表达式的大小写;

re.M,re.MULTILINE:正则表达式中的 ^ 操作符能够将给定字符串的每行当做匹配的开始;

re.S,re.DOTALL:正则表达式中的 . 操作符能够匹配所有字符。

最后将匹配到的字符串进行输出,使用下述代码即可实现。


import re
my_str = ' good good'
pattern = r''
ret = re.search(pattern, my_str)
if ret:
    print(ret.group(0))

re.match 函数

该函数用于在目标字符串开始位置去匹配正则表达式,返回 match 对象,未匹配成功返回 None,函数原型如下:

re.match(pattern,string,flags=0)


一定要注意是目标字符串开始位置。

import re
my_str = ' good good'
pattern = r'' # 匹配到数据
pattern = r'good' # 匹配不到数据
ret = re.match(pattern, my_str)
if ret:
    print(ret.group(0))

re.matchre.search 方法都是一次最多返回一个匹配对象,如果希望返回多个值,

可以通过在 pattern 里加括号构造匹配组返回多个字符串。


re.findall 函数

该函数用于搜索字符串,以列表格式返回全部匹配到的字符串,函数原型如下:

re.findall(pattern,string,flags=0)


测试代码如下:

import re
my_str = ' good good'
pattern = r'good'
ret = re.findall(pattern, my_str)
print(ret)

re.split 函数

该函数将一个字符串按照正则表达式匹配结果进行分割,返回一个列表。

函数原型如下:

re.split(pattern, string, maxsplit=0, flags=0)


re.split 函数进行分割的时候,如果正则表达式匹配到的字符恰好在字符串开头或者结尾,

返回分割后的字符串列表首尾都多了空格,需要手动去除,例如下述代码:

import re
my_str = '11good1good1'
pattern = r'\d'
ret = re.split(pattern, my_str)
print(ret)

运行结果:

['', '', 'good', 'good', '']

切换为中间的内容,则能正确的分割字符串。

import re
my_str = '11good1good1'
pattern = r'good'
ret = re.split(pattern, my_str)
print(ret)

如果在 pattern 中捕获到括号,那括号中匹配到的结果也会在返回的列表中。

import re
my_str = '11good1good1'
pattern = r'(good)'
ret = re.split(pattern, my_str)
print(ret)

运行结果,你可以对比带括号和不带括号的区别进行学习:

['11', 'good', '1', 'good', '1']


maxsplit 参数表示最多进行分割次数, 剩下的字符全部返回到列表的最后一个元素,

例如设置匹配 1 次,得到的结果是 ['1梦想橡皮擦1', '1good1']。


re.finditer 函数

搜索字符串,并返回一个匹配结果的迭代器,每个迭代元素都是 match 对象。

函数原型如下:

re.finditer(pattern,string,flags=0)


测试代码如下:

import re
my_str = '11good1good1'
pattern = r'good'
# ret = re.split(pattern, my_str,maxsplit=1)
ret =re.finditer(pattern, my_str)
print(ret)

re.sub 函数

在一个字符串中替换被正则表达式匹配到的字符串,返回替换后的字符串,

函数原型如下:

re.sub(pattern,repl,string,count=0,flags=0)


其中 repl 参数是替换匹配字符串的字符串,count 参数是匹配的最大替换次数。

import re
my_str = '11good1good1'
pattern = r'good'
ret = re.sub(pattern, "nice", my_str)
print(ret)

运行之后,得到替换之后的字符串:

11nice1nice1

re 库其它函数

其它比较常见的函数有:re.fullmatch()re.subn()re.escape()

相关文章
|
5天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
111 55
|
1月前
|
数据采集 缓存 定位技术
网络延迟对Python爬虫速度的影响分析
网络延迟对Python爬虫速度的影响分析
|
1月前
|
Python
Python中的异步编程:使用asyncio和aiohttp实现高效网络请求
【10月更文挑战第34天】在Python的世界里,异步编程是提高效率的利器。本文将带你了解如何使用asyncio和aiohttp库来编写高效的网络请求代码。我们将通过一个简单的示例来展示如何利用这些工具来并发地处理多个网络请求,从而提高程序的整体性能。准备好让你的Python代码飞起来吧!
74 2
|
1月前
|
数据采集 存储 JSON
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理,以及存储爬取的数据。通过具体示例,帮助读者掌握Scrapy的核心功能和使用方法,提升数据采集效率。
105 6
|
15天前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
93 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
15天前
|
机器学习/深度学习 人工智能 算法
深度学习入门:用Python构建你的第一个神经网络
在人工智能的海洋中,深度学习是那艘能够带你远航的船。本文将作为你的航标,引导你搭建第一个神经网络模型,让你领略深度学习的魅力。通过简单直观的语言和实例,我们将一起探索隐藏在数据背后的模式,体验从零开始创造智能系统的快感。准备好了吗?让我们启航吧!
42 3
|
20天前
|
网络安全 Python
Python网络编程小示例:生成CIDR表示的IP地址范围
本文介绍了如何使用Python生成CIDR表示的IP地址范围,通过解析CIDR字符串,将其转换为二进制形式,应用子网掩码,最终生成该CIDR块内所有可用的IP地址列表。示例代码利用了Python的`ipaddress`模块,展示了从指定CIDR表达式中提取所有IP地址的过程。
35 6
|
23天前
|
机器学习/深度学习 自然语言处理 语音技术
Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧
本文介绍了Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧,并通过TensorFlow和PyTorch等库展示了实现神经网络的具体示例,涵盖图像识别、语音识别等多个应用场景。
48 8
|
22天前
|
数据采集 XML 存储
构建高效的Python网络爬虫:从入门到实践
本文旨在通过深入浅出的方式,引导读者从零开始构建一个高效的Python网络爬虫。我们将探索爬虫的基本原理、核心组件以及如何利用Python的强大库进行数据抓取和处理。文章不仅提供理论指导,还结合实战案例,让读者能够快速掌握爬虫技术,并应用于实际项目中。无论你是编程新手还是有一定基础的开发者,都能在这篇文章中找到有价值的内容。
|
1月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
78 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络