回顾
在上一篇《Python集合详解》中,我们介绍了集合的相关方法,简单回顾一下:
- 创建集合:{ } 和set()函数两种方式
- 集合添加元素:setname.add(element)
- 集合删除元素:setname.remove(element)
- 清空集合:setname.clear()
- 集合求交集:& 或 intersection()
- 集合求并集:| 或 union()
- 集合求差集:- 或 difference()
- 复制集合:setname.copy()
这次的主题是Python中很重要的一个数据类型:字符串。
一、字符串切片
从本质上讲,字符串是由多个字符构成的,字符之间是有顺序的,这个顺序号称为索引(index)。
1.获取单个字符
在方括号[ ]中使用索引即可访问对应的字符,具体的语法格式为:
strname[index]
Python 允许从字符串的两端使用索引:
- 当以字符串的左端(字符串的开头)为起点时,索引是从 0 开始计数的;字符串的第一个字符的索引为 0,第二个字符的索引为 1,第三个字符串的索引为 2 ……以此类推
- 当以字符串的右端(字符串的末尾)为起点时,索引是从 -1 开始计数的;字符串的倒数第一个字符的索引为 -1,倒数第二个字符的索引为 -2,倒数第三个字符的索引为 -3 ……以此类推
str1 ="life is short,i need PYTHON"# 字符串查找print(str1.find('s', 0, -1)) # 查找指定范围内是否存在某字符,是返回下标,不存在返回-1# 获取单个字符a = str1[0] # 第一个字符b = str1[-1] # 最后一个字符print(a) # 1print(b) # N
2.获取多个字符(字符串截取/切片)
使用[ ]除了可以获取单个字符外,还可以指定一个范围来获取多个字符,也就是一个子串或者片段,具体格式为:
strname[start : end : step]
# 获取多个字符(字符串切片)c = str1[0:3] # 获取str1的第1个到第3个之间的字符,步长默认为1d = str1[0:5:2] # 获取str1的第1个到第5个之间的字符,指定默认为2
二、len():获取对象长度和字节长度
Python 中,要想知道一个对象长度,或者一个字符串占用多少个字节,可以使用 len 函数。len 函数的基本语法格式为:
len(obj)
其中 obj用于指定要进行长度统计的对象,可以是字符串、列表、元组、字典等。 通过使用 encode() 方法,将字符串进行编码后再获取它的字节数。例如,采用 UTF-8 编码方式,计算“人生苦短,我用Python”的字节数,可以执行如下代码:
# 获取对象长度str2 ="人生苦短,我用PYTHON"print(len(str2)) # 13print(len(str2.encode())) # 27,使用encode()方法转码为字节,一个中文字符占用3个字节
三、join()方法:合并字符串
Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。语法格式:
newstr = str.join(iterable)
此方法中各参数的含义如下:
- newstr:表示合并后生成的新字符串;
- str:用于指定合并时的分隔符;
- iterable:做合并操作的源字符串数据,允许以列表、元组等形式提供。
# 合并字符串list_a = ['a', 'b', 'c', 'd', 'e'] print("".join(list_a)) # abcde 默认连接符print("#".join(list_a)) # a#b#c#d#e 指定连接符# 字符串拼接str_a ="人生苦短"str_b ="我用PYTHON"print(str_a + str_b) # 人生苦短我用PYTHON# 字符串追加字符print(str_b.join(str_a)) # 人我用PYTHON生我用PYTHON苦我用PYTHON短 输出的为无序的字符串
四、split()方法:字符串分隔
# 字符串分隔str2 ="life is short,i need python"print(str1.split(' ')) # ['life', 'is', 'short,i', 'need', 'PYTHON']
五、替换与删除指定字符
- str.replace(old, new,count),替换指定字符(不加count默认全替换)
- str.replace(old, '',count),将指定字符用空字符代替、从而达到删除的目的(不加count默认全替换)
# 字符串替换指定字符(用大写的LIFE字符代替小写的life)print(str2.replace('life', 'LIFE')) # LIFE is short,i need python# 字符串删除指定字符(用空字符代替字符i,从而达到删除目的)print(str2.replace('i', '')) # lfe s short, need python
六、字符串格式化输出
1.来自C语言的%方式
%号格式化字符串的方式继承自古老的C语言,这在很多编程语言都有类似的实现。%s是一个占位符,它仅代表一段字符串,并不是拼接的实际内容。实际的拼接内容在一个单独的%号后面,放在一个元组里。 类似的占位符还有:
- %d(代表一个整数)
- %f(代表一个浮点数)
- %x(代表一个16进制数)
%占位符既是这种拼接方 式的特点,同时也是其限制因为每种占位符都有特定意义,实际使用起来较为麻烦。
# 使用占位符name ="dang"age =5print("我叫%s,我今年%s岁了" % (name, age)) # 我叫dang,我今年5岁了print("%d" % (20)) # 八进制 20print("%o" % (20)) # 十进制 24print("%x" % (20)) # 十六进制 14
2.format()拼接方式
# format()拼接方式name1 ="当当"name2 ="刚刚"age =5print("我叫{},我今年{}岁了".format(name1, age)) # 我叫当当,我今年5岁了print("我叫{1},我叫{0}".format(name1, name2)) # 使用编号指定顺序 "我叫刚刚,我叫当当"print("我叫{name},我今年{age}岁了".format(name=name1, age=age)) # 使用变量名指定顺序 "我叫当当,我今年5岁了"
3.f-string方式
f-string方式出自PEP 498(Literal String Interpolation,字面字符串插值),从Python3.6版本引入。其特点是在字符串前加 f 标识,字符串中间则用花括号{}包裹其他字符串变量。
# f-string方式name3 ="jigang.chen"age =28print(f"我叫{name3},我今年{age}岁了") # 我叫jigang.chen,我今年28岁了print(f"a total number is {20 * 2 + 8}") # 处理表达式 a total number is 48name ="PYTHON"print(f"my name is {name.lower()}") # 处理方法调用 my name is python
七、字符串其他方法
str1 ="life is short,i need PYTHON"# 计算某个字符出现的次数print(str1.count('i')) # 3# 在指定区间内查找某个字符,并返回该字符的索引print(str1.find('f', 0, -1)) # 2# 将字符串全部转换为小写print(str1.lower()) # life is short,i need python
总结
列表、元组、字符串都是有序序列,而字典、集合都是无序序列,无法通过下标获取元素;
列表、字典、集合都是可变序列,而元组、字符串是不可变序列,一旦创建,就无法更改;