Python-字符串相关操作

简介: Python-字符串相关操作

字符串

三种引号的区别

  • Python中单引号(')字符串和双引号(")字符串是等价的. 而不像有些编程语言(比如Linux Shell), 转义字符只在双引号中有效.
  • Python中使用 "原始字符串" 来完成这样的功能
  • 三引号('''/""")相比于前两种的区别是, 可以跨多行.

    • 三引号还可以作为文档字符串

理解字符串 "不可变"

  • 字符串实际上是不可变的对象. 你不能修改这个字符串, 只能创建一个新的字符串.
a = 'abcd'
a[0] ='z'    #TypeError: 'str' object does not support item assignment

a = 'z'+a[1:]
print(a)    #zbcd

字符串的标准类型操作符

  • ==, !=, <, <=, >, >= 这些操作符的行为前面已经提到过.
  • 需要记得字符串比较大小是按照字典序.
a = 'abc'
b = 'ab'
print(a != b)    #True
print(a < b)    #False    按照字典序比较

  • in/not in的规则和序列的规则一致.
a = 'abc'
print('a' in a)    #True
print('z' in a)    #False
  • 切片操作和序列规则一致
a = 'abcd'
print(a[1:2])   #b
print(a[:2])    #ab
print(a[1:])    #bcd
print(a[:])     #abcd
print(a[::2])   #ac

只适用于字符串的操作符

  • %: 格式化替换.
x = 1
print('x = %d' %x)    # x = 1

x = 10
y = 20
a = 'x = %d y = %d' %x #缺少参数:报错 TypeError: not enough arguments for format string

#正解:
x = 10
y = 20
a = 'x = %d y = %d' %(x,y)

推荐写法:加前缀f
x = 10
y = 20
a = f'x = {x},y={y}'
print(a)    #x = 10,y=20

支持以下这些格式化字符串:

image-20220318092103605


原始字符串(raw strings)

有的时候, 我们需要有 \n 这样的字符作为转义字符. 但是有些时候我们又不希望进行转义, 只需要原始的
\n 作为字符串的一部分.

原始字符串中, 转义字符不生效

例子:QQ发消息时, 有一个 "表情快捷键" 的功能. 这个功能就相当于 "转义字符".

当开启了这个功能之后, 在输入框中输入 /se 就会被替换成一个表情. 比如我给同事发一个目录 /search/odin (这本来是表示linux上的一个目录)

image-20220318092315185


这种情况下, 我们需要关闭 "表情快捷键" 功能. 对于Python来说, 我们就可以使用原始字符串来解决这个问题.


  • 在字符串字面值前加上 r或者R 前缀, 表示原始字符串
print(r'hello \n world')    #hello \n world

repr函数和反引号操作符

  • 用str函数可以将一些对象转换成字符串. repr也有类似的效果.
a = 1
print(type(repr(a)))    #<class 'str'> 字符串类型

print(str('hello'))        # hello
print(repr('hello'))    # 'hello'

总结一下, str转换出的字符串是给人看的. 而repr转换出的字符串, 是给Python解释器看的.

  • 意思是说, repr得出的结果, 其实是一个Python语句, 可以直接放到解释器里执行~

  • 反引号, 和repr函数等价

string 模块常用函数

  • Python标准库提供了string模块, 包含了很多非常方便实用的函数

注意点:记得字符串是不可变对象, 只能生成新字符串

image-20220319153446313

image-20220319153454157


image-20220319153507776


image-20220319153514842


image-20220319153520363


join函数
将序列中的字符串合并成一个字符串. join函数
a = ['aa','bb','cc']
b = ' '.join(a)
print(b)    #aa bb cc

split函数
按空格将字符串分割成列表 split函数
a = 'aa bb cc'
b = a.split(' ')
print(b)    #['aa', 'bb', 'cc']
通常和join函数一起使用
a = 'aaa,bbb,ccc'
b = a.split(',') #以,分割成列表
print(b)
print(';'.join(b)) #分号连接
print('hello'.join(b))

#执行结果:
['aaa', 'bbb', 'ccc']
aaa;bbb;ccc
aaahellobbbhelloccc

startswith函数 和 endswith函数
判定字符串开头结尾 startswith函数 和 endswith函数
a = 'hello world'
print(a.startswith('h'))    #True
print(a.startswith('hee'))    #False
print(a.endswith('d'))        #True

strip函数
去除字符串开头结尾的空格/制表符 strip函数

空白字符:空格,换行,tab

a = '       hello world             '
print(a.strip())    #hello world

去掉左侧的空白字符:lstrip

去掉右侧的空白字符: rstrip

a ='    hello   \n'
print(f'[{a.lstrip()}]')     #为了方便看,加上[]
print(f'[{a.rstrip()}]')
print(f'[{a.strip()}]')
#执行结果:
[hello   
]
[    hello]
[hello]

ljust rjust center函数
左对齐/右对齐/中间对齐 ljust rjust center函数
a = '    hello world'
print(a.ljust(30))
print(a.rjust(30))
print(a.center(30))
#执行结果:
    hello world               
                   hello world
           hello world        
find函数
查找子串 find函数
a = '    hello world'
print(a.find('hello'))    #4
a = 'hello hello '
print(a.find('h'))    #0

返回第一次出现的下标

in差不多,in返回的是布尔值

a = '    hello world'
print(a.find('hello'))    #4
print('hello' in a)    #True

replace函数
替换子串( 记得字符串是不可变对象, 只能生成新字符串). replace函数
a=  'hello world'
print(a.replace('world','python'))    #hello python
print(a)    #hello world    字符串是不可变对象, 只能生成新字符串

isalpha函数 和 isdigit函数
判定字符串是字母/数字 isalpha函数 和 isdigit函数
a = 'hello 1'
print(a.isalpha())    #False
a = '1234'
print(a.isdigit())    #True

lower和upper函数
转换大小写 lower和upper函数
a = 'Hello world'
print(a.lower())    #hello world
print(a.upper())    #HELLO WORLD

关于结束符

学过C语言的同学, 可能会问, Python的字符串是否需要 '\0' 之类的结束符来做结尾?

  • Python中并没有那个讨厌的 '\0'. 准确的说, 对于C语言来说, 语言本身的缺陷并不支持 "字符串类型", 才被迫使用字符数组来凑合. 但是Python完全没有这个包袱.

列表 []

字符串只能由字符组成, 而且不可变; 但是列表中可以包含任意类型的对象, 使用更加灵活.

相关文章
|
22天前
|
Python
在 Python 中,如何将日期时间类型转换为字符串?
在 Python 中,如何将日期时间类型转换为字符串?
119 64
|
4月前
|
存储 算法 数据库
使用python hashlib模块给明文字符串加密,以及如何撞库破解密码
`hashlib` 是 Python 中用于实现哈希功能的模块,它可以将任意长度的输入通过哈希算法转换为固定长度的输出,即散列值。该模块主要用于字符串加密,例如将用户名和密码转换为不可逆的散列值存储,从而提高安全性。`hashlib` 提供了多种哈希算法,如 `md5`、`sha1`、`sha256` 等。
68 1
|
14天前
|
存储 测试技术 Python
Python 中别再用 ‘+‘ 拼接字符串了!
通过选择合适的字符串拼接方法,可以显著提升 Python 代码的效率和可读性。在实际开发中,根据具体需求和场景选择最佳的方法,避免不必要的性能损失。
38 5
|
18天前
|
Python
使用Python计算字符串的SHA-256散列值
使用Python计算字符串的SHA-256散列值
24 7
|
24天前
|
Python
在 Python 中,如何将字符串中的日期格式转换为日期时间类型?
在 Python 中,如何将字符串中的日期格式转换为日期时间类型?
32 6
|
2月前
|
Python
【10月更文挑战第6天】「Mac上学Python 11」基础篇5 - 字符串类型详解
本篇将详细介绍Python中的字符串类型及其常见操作,包括字符串的定义、转义字符的使用、字符串的连接与格式化、字符串的重复和切片、不可变性、编码与解码以及常用内置方法等。通过本篇学习,用户将掌握字符串的操作技巧,并能灵活处理文本数据。
60 1
【10月更文挑战第6天】「Mac上学Python 11」基础篇5 - 字符串类型详解
|
3月前
|
Python
python获取字符串()里面的字符
在Python中,如果你想获取字符串中括号(比如圆括号`()`、方括号`[]`或花括号`{}`)内的字符,你可以使用正则表达式(通过`re`模块)或者手动编写代码来遍历字符串并检查字符。 这里,我将给出使用正则表达式的一个例子,因为它提供了一种灵活且强大的方式来匹配复杂的字符串模式。 ### 使用正则表达式 正则表达式允许你指定一个模式,Python的`re`模块可以搜索字符串以查找匹配该模式的所有实例。 #### 示例:获取圆括号`()`内的内容 ```python import re def get_content_in_parentheses(s): # 使用正则表达
115 36
|
2月前
|
自然语言处理 Java 数据处理
【速收藏】python字符串操作,你会几个?
【速收藏】python字符串操作,你会几个?
61 7
|
2月前
|
索引 Python
Python 高级编程:深入探索字符串切片
在Python中,字符串切片功能强大,可灵活提取特定部分。本文详细介绍切片技巧:基本切片、省略起始或结束索引、使用负数索引、设定步长及反转字符串等。此外,还介绍了如何结合其他操作进行切片处理,如先转换大小写再提取子串。 来源:https://www.wodianping.com/yeyou/2024-10/48238.html
46 4
|
3月前
|
Python
python第三方库-字符串编码工具 chardet 的使用(python3经典编程案例)
这篇文章介绍了如何使用Python的第三方库chardet来检测字符串的编码类型,包括ASCII、GBK、UTF-8和日文编码的检测示例。
156 6
下一篇
DataWorks