Python学习的自我理解和想法(22)

简介: 本文记录了作者学习Python第22天的内容——正则表达式,基于B站千锋教育课程。文章简要介绍了正则表达式的概念、特点及使用场景(如爬虫、数据清洗等),并通过示例解析了`re.search()`、`re.match()`、拆分、替换和匹配中文等基本语法。正则表达式是文本处理的重要工具,尽管入门较难,但功能强大。作者表示后续会深入讲解其应用,并强调学好正则对爬虫学习的帮助。因时间有限,内容为入门概述,不足之处敬请谅解。

学的是b站的课程(千锋教育),跟老师写程序,不是自创的代码!
今天是学Python的第22天,学的内容是正则表达式,明天会出一篇详细实例介绍。电脑刚修好!开学了,时间不多,写得不多,见谅。
目录

  1. 正则表达式简介
    (1).语法
    (2).简介
    (3).特点
    (4).使用场景
  2. 导入概念
  3. 解析代码
    4.正则的基本语法
    (1).查找函数
    (1).re.match( )
    (2).re.search( )
    (2).拆分
    (3).替换
    (4).匹配中文
    总结

1. 正则表达式简介

(1).语法

656839fc0d1046bb81cfd92d64d6aa6b.jpg
这里是部分,详细版在后面会出.

(2).简介

是一个特殊的字符序列,计算机科学中的一个概念,主要用来检索\替换那些符合某个模式的文本。在python中使用正则表达式,借助的是re模块,通过re模块可以实现正则表达式的绝大多数的功能。正则表达式在文本处理中扮演着至关重要的角色。它就像是一把神奇的钥匙,可以打开复杂文本数据中的秘密之门。它拥有自己独特的语法和处理引擎,虽然在效率上可能不如一些字符串自带的方法,但在功能的强大性上无可比拟。

(3).特点

1.灵活性\功能性\逻辑性非常强
2.可以使用极简单的方式达到字符串的复杂控制.

(4).使用场景

爬虫
验证手机号,身份证号,邮箱等
数据分析的数据清洗或整理

2. 导入概念

要求:封装一个功能,判断用户输入的手机号码是否合法.

普通方法

image.png

正则表达式方法

image.png

3. 解析代码

re.search(r"^1\d{10}$",checkPhone)

首先,^ 表示的是正则表达式的开始,\d表示0-9之间的数字,{10}表示重复10次,$表示正则表达式的结束,checkPhone表示被正则表达式检测的变量。结果是一个布尔类型,所以可以用if语句进行检测.

4.正则的基本语法

(1).查找函数

(1).re.match( )

语法:匹配字符串是否以指定的正则内容开头,匹配成功返回对象,匹配失败返回None。
第一个参数:正则表达式;
第二个参数:要验证的字符;
第三个参数:可选参数,正则表达式的修饰符.
只能匹配数字开头的,同时也不能匹配到非数字后面的数字!
image.png

(2).re.search( )

语法:匹配字符串中是否包含指定的内容,匹配成功返回对象,匹配失败返回None.
可以匹配非数字开头的,但不能匹配到非数字后面的数字!
image.png

(2).拆分

语法:re.spilt(正则表达式,"要处理的数据")
image.png

(3).替换

语法:re.sub(正则表达式,替换后的内容,要替换的字符串)
image.png

(4).匹配中文

语法:最常见的,定义chinese=“[\u4e00-\u9fa5]+]”
image.png
自我理解:在这文章只是对正则表达式的一篇简单的介绍入门而已,后面会写一篇文章来介绍不同的正则表达式的使用方法。正则表达式是一篇特别难的知识点,它的应用范围很广,而且它的代码只有在特定的环境中才会很好的被理解。
我们后面写爬虫的时候会继续讲解正则表达式,学好正则表达式对后面的爬虫的理解也很有帮助。

总结

这是我今天学Python的自我想法和对其的理解,有不对的地方请同志们多多包涵,谢谢观看!

相关文章
|
15天前
|
安全 数据安全/隐私保护 Python
Python学习的自我理解和想法(27)
本文记录了学习Python第27天的内容,主要介绍了使用Python操作PPTX和PDF的技巧。其中包括通过`python-pptx`库创建PPTX文件的详细步骤,如创建幻灯片对象、选择母版布局、编辑标题与副标题、添加文本框和图片,以及保存文件。此外,还讲解了如何利用`PyPDF2`库为PDF文件加密,涵盖安装库、定义函数、读取文件、设置密码及保存加密文件的过程。文章总结了Python在处理文档时的强大功能,并表达了对读者应用这些技能的期待。
|
10天前
|
存储 搜索推荐 算法
Python学习的自我理解和想法(28)
本文记录了学习Python第28天的内容——冒泡排序。通过B站千锋教育课程学习,非原创代码。文章详细介绍了冒泡排序的起源、概念、工作原理及多种Python实现方式(普通版、进阶版1和进阶版2)。同时分析了其时间复杂度(最坏、最好、平均情况)与空间复杂度,并探讨了实际应用场景(如小规模数据排序、教学示例)及局限性(如效率低下、不适用于高实时性场景)。最后总结了冒泡排序的意义及其对初学者的重要性。
|
16天前
|
Python
Python学习的自我理解和想法(26)
这是一篇关于使用Python操作Word文档的学习总结,基于B站千锋教育课程内容编写。主要介绍了通过`python-docx`库在Word中插入列表(有序与无序)、表格,以及读取docx文件的方法。详细展示了代码示例与结果,涵盖创建文档对象、添加数据、设置样式、保存文件等步骤。虽为开学后时间有限下的简要记录,但仍清晰梳理了核心知识点,有助于初学者掌握自动化办公技巧。不足之处欢迎指正!
|
23天前
|
索引 Python
Python学习的自我理解和想法(24)
本文记录了学习Python操作Excel的第24天内容,基于B站千锋教育课程。主要介绍openpyxl插件的使用,包括安装、读取与写入Excel文件、插入图表等操作。具体内容涵盖加载工作簿、获取单元格数据、创建和保存工作表,以及通过图表展示数据。因开学时间有限,文章简要概述了各步骤代码实现,适合初学者参考学习。如有不足之处,欢迎指正!
|
20天前
|
Python
Python学习的自我理解和想法(25)
这是一篇关于Python操作Word文档(docx)的教程总结,基于B站千锋教育课程学习(非原创代码)。主要内容包括:1) docx库插件安装;2) 创建与编辑Word文档,如添加标题、段落、设置字体样式及保存;3) 向新或现有Word文档插入图片。通过简单示例展示了如何高效使用python-docx库完成文档操作。因开学时间有限,内容精简,后续将更新列表和表格相关内容。欢迎指正交流!
|
27天前
|
Python
Python学习的自我理解和想法(23)
本文记录了学习Python正则表达式的第23天心得,内容基于B站麦叔课程。文章分为三个部分:1) 正则表达式的七个境界,从固定字符串到内部约束逐步深入;2) 写正则表达式的套路,以座机号码为例解析模式设计;3) 正则表达式语法大全,涵盖字符类别、重复次数、组合模式、位置、分组、标记、特殊字符和替换等知识点。总结中表达了对知识的理解,并欢迎指正。
|
2月前
|
机器学习/深度学习 存储 设计模式
Python 高级编程与实战:深入理解性能优化与调试技巧
本文深入探讨了Python的性能优化与调试技巧,涵盖profiling、caching、Cython等优化工具,以及pdb、logging、assert等调试方法。通过实战项目,如优化斐波那契数列计算和调试Web应用,帮助读者掌握这些技术,提升编程效率。附有进一步学习资源,助力读者深入学习。
|
12天前
|
数据采集 安全 BI
用Python编程基础提升工作效率
一、文件处理整明白了,少加两小时班 (敲暖气管子)领导让整理100个Excel表?手都干抽筋儿了?Python就跟铲雪车似的,哗哗给你整利索!
50 11
|
2月前
|
人工智能 Java 数据安全/隐私保护
[oeasy]python081_ai编程最佳实践_ai辅助编程_提出要求_解决问题
本文介绍了如何利用AI辅助编程解决实际问题,以猫屎咖啡的购买为例,逐步实现将购买斤数换算成人民币金额的功能。文章强调了与AI协作时的三个要点:1) 去除无关信息,聚焦目标;2) 将复杂任务拆解为小步骤,逐步完成;3) 巩固已有成果后再推进。最终代码实现了输入验证、单位转换和价格计算,并保留两位小数。总结指出,在AI时代,人类负责明确目标、拆分任务和确认结果,AI则负责生成代码、解释含义和提供优化建议,编程不会被取代,而是会更广泛地融入各领域。
103 28
|
2月前
|
机器学习/深度学习 数据可视化 TensorFlow
Python 高级编程与实战:深入理解数据科学与机器学习
本文深入探讨了Python在数据科学与机器学习中的应用,介绍了pandas、numpy、matplotlib等数据科学工具,以及scikit-learn、tensorflow、keras等机器学习库。通过实战项目,如数据可视化和鸢尾花数据集分类,帮助读者掌握这些技术。最后提供了进一步学习资源,助力提升Python编程技能。