字符串
三种引号的区别
- Python中单引号(')字符串和双引号(")字符串是等价的. 而不像有些编程语言(比如Linux Shell), 转义字符只在双引号中有效.
- Python中使用 "原始字符串" 来完成这样的功能
三引号('''/""")相比于前两种的区别是, 可以跨多行.
- 三引号还可以作为文档字符串
理解字符串 "不可变"
- 字符串实际上是不可变的对象. 你不能修改这个字符串, 只能创建一个新的字符串.
a = 'abcd'
a[0] ='z' #TypeError: 'str' object does not support item assignment
a = 'z'+a[1:]
print(a) #zbcd
字符串的标准类型操作符
- ==, !=, <, <=, >, >= 这些操作符的行为前面已经提到过.
- 需要记得字符串比较大小是按照字典序.
a = 'abc'
b = 'ab'
print(a != b) #True
print(a < b) #False 按照字典序比较
- in/not in的规则和序列的规则一致.
a = 'abc'
print('a' in a) #True
print('z' in a) #False
- 切片操作和序列规则一致
a = 'abcd'
print(a[1:2]) #b
print(a[:2]) #ab
print(a[1:]) #bcd
print(a[:]) #abcd
print(a[::2]) #ac
只适用于字符串的操作符
- %: 格式化替换.
x = 1
print('x = %d' %x) # x = 1
x = 10
y = 20
a = 'x = %d y = %d' %x #缺少参数:报错 TypeError: not enough arguments for format string
#正解:
x = 10
y = 20
a = 'x = %d y = %d' %(x,y)
推荐写法:加前缀f
x = 10
y = 20
a = f'x = {x},y={y}'
print(a) #x = 10,y=20
支持以下这些格式化字符串:
原始字符串(raw strings)
有的时候, 我们需要有 \n 这样的字符作为转义字符. 但是有些时候我们又不希望进行转义, 只需要原始的
\n 作为字符串的一部分.
原始字符串中, 转义字符不生效
例子:QQ发消息时, 有一个 "表情快捷键" 的功能. 这个功能就相当于 "转义字符".当开启了这个功能之后, 在输入框中输入 /se 就会被替换成一个表情. 比如我给同事发一个目录 /search/odin (这本来是表示linux上的一个目录)
这种情况下, 我们需要关闭 "表情快捷键" 功能. 对于Python来说, 我们就可以使用原始字符串来解决这个问题.
- 在字符串字面值前加上 r或者R 前缀, 表示原始字符串
print(r'hello \n world') #hello \n world
repr函数和反引号操作符
- 用str函数可以将一些对象转换成字符串. repr也有类似的效果.
a = 1
print(type(repr(a))) #<class 'str'> 字符串类型
print(str('hello')) # hello
print(repr('hello')) # 'hello'
总结一下, str转换出的字符串是给人看的. 而repr转换出的字符串, 是给Python解释器看的.
- 意思是说, repr得出的结果, 其实是一个Python语句, 可以直接放到解释器里执行~
- 反引号, 和repr函数等价
string 模块常用函数
- Python标准库提供了string模块, 包含了很多非常方便实用的函数
注意点:记得字符串是不可变对象, 只能生成新字符串
join函数
将序列中的字符串合并成一个字符串. join函数
a = ['aa','bb','cc']
b = ' '.join(a)
print(b) #aa bb cc
split函数
按空格将字符串分割成列表 split函数
a = 'aa bb cc'
b = a.split(' ')
print(b) #['aa', 'bb', 'cc']
通常和join函数一起使用
a = 'aaa,bbb,ccc'
b = a.split(',') #以,分割成列表
print(b)
print(';'.join(b)) #分号连接
print('hello'.join(b))
#执行结果:
['aaa', 'bbb', 'ccc']
aaa;bbb;ccc
aaahellobbbhelloccc
startswith函数 和 endswith函数
判定字符串开头结尾 startswith函数 和 endswith函数
a = 'hello world'
print(a.startswith('h')) #True
print(a.startswith('hee')) #False
print(a.endswith('d')) #True
strip函数
去除字符串开头结尾的空格/制表符 strip函数
空白字符:空格,换行,tab
a = ' hello world '
print(a.strip()) #hello world
去掉左侧的空白字符:lstrip
去掉右侧的空白字符: rstrip
a =' hello \n'
print(f'[{a.lstrip()}]') #为了方便看,加上[]
print(f'[{a.rstrip()}]')
print(f'[{a.strip()}]')
#执行结果:
[hello
]
[ hello]
[hello]
ljust rjust center函数
左对齐/右对齐/中间对齐 ljust rjust center函数
a = ' hello world'
print(a.ljust(30))
print(a.rjust(30))
print(a.center(30))
#执行结果:
hello world
hello world
hello world
find函数
查找子串 find函数
a = ' hello world'
print(a.find('hello')) #4
a = 'hello hello '
print(a.find('h')) #0
返回第一次出现的下标
和in
差不多,in返回的是布尔值
a = ' hello world'
print(a.find('hello')) #4
print('hello' in a) #True
replace函数
替换子串( 记得字符串是不可变对象, 只能生成新字符串). replace函数
a= 'hello world'
print(a.replace('world','python')) #hello python
print(a) #hello world 字符串是不可变对象, 只能生成新字符串
isalpha函数 和 isdigit函数
判定字符串是字母/数字 isalpha函数 和 isdigit函数
a = 'hello 1'
print(a.isalpha()) #False
a = '1234'
print(a.isdigit()) #True
lower和upper函数
转换大小写 lower和upper函数
a = 'Hello world'
print(a.lower()) #hello world
print(a.upper()) #HELLO WORLD
关于结束符
学过C语言的同学, 可能会问, Python的字符串是否需要 '\0' 之类的结束符来做结尾?
- Python中并没有那个讨厌的 '\0'. 准确的说, 对于C语言来说, 语言本身的缺陷并不支持 "字符串类型", 才被迫使用字符数组来凑合. 但是Python完全没有这个包袱.
列表 []
字符串只能由字符组成, 而且不可变; 但是列表中可以包含任意类型的对象, 使用更加灵活.