Python进阶语法之字符串

简介: Python进阶语法之字符串

Python进阶语法之字符串

当我们处理文本数据时,字符串是不可避免的数据类型。Python 提供了很多字符串方法,它们可以帮助我们更方便地操作和处理字符串。在本篇博客中,我们将深入探讨 Python 字符串。




字符串的基本操作


在深入了解字符串方法之前,我们首先要了解一些基本的字符串操作,例如索引、切片和拼接。

  • 索引:我们可以通过索引来访问字符串中的单个字符。
s = 'hello'
print(s[1])  # 输出: 'e'


  • 切片:我们可以使用切片来获取字符串的子串。
s = 'hello'
print(s[1:3])  # 输出: 'el'


  • 拼接:我们可以使用+操作符来拼接两个字符串。
s1 = 'hello'
s2 = 'world'
print(s1 + s2)  # 输出: 'helloworld'



字符串的方法


在 Python 中,字符串是一个不可变对象。这意味着一旦我们定义了一个字符串,就不能直接修改它的值。但是,我们可以使用字符串方法来对字符串进行各种操作,例如查找子字符串、替换子字符串、拼接字符串等等。下面是一些常用的字符串方法:


   str.capitalize():把字符串的第一个字符转换为大写字母。


   str.casefold():把字符串中所有字符转换为小写字母,并返回转换后的字符串。该方法比 str.lower() 更强大,因为它可以正确处理某些特殊字符(例如德语中的 eszett)。


   str.center(width[, fillchar]):返回一个指定宽度的居中对齐的字符串,如果指定的宽度小于字符串长度,则返回原字符串。


   str.count(sub[, start[, end]]):返回字符串中子字符串 sub 出现的次数,可选参数 start 和 end 指定查找范围。


   str.encode([encoding[, errors]]):返回字符串的字节串表示。如果指定了编码方式(例如 ‘utf-8’),则按照该编码方式进行编码。可选参数 errors 指定编码错误处理方式。


   str.endswith(suffix[, start[, end]]):检查字符串是否以指定的后缀 suffix 结束。可选参数 start 和 end 指定查找范围。


   str.expandtabs([tabsize]):把字符串中的制表符(‘\t’)替换为指定数量的空格,默认为 8。


   str.find(sub[, start[, end]]):在字符串中查找子字符串 sub,返回它在字符串中第一次出现的位置。如果未找到,则返回 -1。可选参数 start 和 end 指定查找范围。


   str.format(*args, **kwargs):使用传递给它的参数格式化字符串(类似于 printf() 函数)。


   str.index(sub[, start[, end]]):在字符串中查找子字符串 sub,返回它在字符串中第一次出现的位置。如果未找到,则引发 ValueError 异常。可选参数 start 和 end 指定查找范围。


   str.isalnum():检查字符串是否只包含字母和数字。


   str.isalpha():检查字符串是否只包含字母。


   str.isdecimal():检查字符串是否只包含十进制数字。


   str.isdigit():检查字符串是否只包含数字字符。


   str.isidentifier():检查字符串是否是一个有效的 Python 标识符。


   str.islower():检查字符串中所有字母是否都是小写字母。


   str.isnumeric():检查字符串是否只包含数字字符。


   str.isprintable():检查字符串中的所有字符是否都是可打印字符,例如空格、标点符号、字母和数字等。


   str.isspace():检查字符串是否只包含空格字符。


   str.istitle():检查字符串中所有单词的首字母是否都是大写字母。


   str.isupper():检查字符串中所有字母是否都是大写字母。


   str.join(iterable):把可迭代对象 iterable 中的元素连接成一个字符串,并返回结果。例如,','.join(['a','b','c']) 返回 ‘a,b,c’。


   str.ljust(width[, fillchar]):返回一个指定宽度的左对齐的字符串,如果指定的宽度小于字符串长度,则返回原字符串。


   str.lower():返回字符串中所有字母的小写形式。str.lstrip([chars]):返回一个去掉字符串开头指定字符(chars)的字符串。如果未指定字符,则默认去掉空格字符。


   str.partition(sep):在字符串中查找分隔符 sep,返回一个以分隔符为界的左侧子字符串、分隔符本身和右侧子字符串的元组。如果未找到分隔符,则返回包含原始字符串和两个空字符串的元组。


   str.replace(old, new[, count]):返回一个把字符串中所有旧子字符串 old 替换为新子字符串 new 的字符串。可选参数 count 指定替换次数。


   str.rfind(sub[, start[, end]]):与 str.find() 方法类似,但是从字符串末尾开始查找。


   str.rindex(sub[, start[, end]]):与 str.index() 方法类似,但是从字符串末尾开始查找。


   str.rjust(width[, fillchar]):返回一个指定宽度的右对齐的字符串,如果指定的宽度小于字符串长度,则返回原字符串。


   str.rpartition(sep):与 str.partition() 方法类似,但是从右侧开始查找分隔符。


   str.rsplit([sep[, maxsplit]]):返回一个把字符串按照指定分隔符(sep)进行分割的列表。


如果未指定分隔符,则默认使用空白字符作为分隔符。可选参数 maxsplit 指定最大分割次数。


   str.rstrip([chars]):返回一个去掉字符串末尾指定字符(chars)的字符串。如果未指定字符,则默认去掉空格字符。


   str.split([sep[, maxsplit]]):返回一个把字符串按照指定分隔符(sep)进行分割的列表。如果未指定分隔符,则默认使用空白字符作为分隔符。可选参数 maxsplit 指定最大分割次数。


   str.splitlines([keepends]):返回一个把字符串按照行分隔符(‘\n’)进行分割的列表。如果 keepends 参数为 True,则保留行分隔符。


   str.startswith(prefix[, start[, end]]):检查字符串是否以指定的前缀 prefix 开头。可选参数 start 和 end 指定查找范围。


   str.strip([chars]):返回一个去掉字符串开头和末尾指定字符(chars)的字符串。如果未指定字符,则默认去掉空格字符。


   str.swapcase():返回一个将字符串中所有小写字母转换为大写字母,所有大写字母转换为小写字母的字符串。


   str.title():返回一个把字符串中每个单词的首字母转换为大写字母的字符串。


   str.translate(table):返回一个根据给定转换表(table)进行转换后的字符串。转换表可以通过 str.maketrans() 方法创建。


   str.upper():返回字符串中所有字母的大写形式。


   str.zfill(width):返回一个指定宽度的右对齐的字符串,左侧用 ‘0’ 填充。如果指定的宽度小于字符串长度,则返回原字符串。




字符串方法的举例说明


  1. capitalize():把字符串第一个字符大写。
str = "hello world"
print(str.capitalize()) # 输出:Hello world



  1. lower():把字符串所有字符转换为小写。
str = "Hello World"
print(str.lower()) # 输出:hello world


  1. upper():把字符串所有字符转换为大写。
str = "hello world"
print(str.upper()) # 输出:HELLO WORLD


  1. title():把字符串每个单词首字母都变成大写。
str = "this is an example"
print(str.title()) # 输出:This Is An Example


  1. strip():去除字符串前后的空格。
str = "   hello world   "
print(str.strip()) # 输出:hello world
  1. replace():替换字符串中指定的子串。
str = "hello world"
print(str.replace("world", "Python")) # 输出:hello Python
  1. split():把字符串按照指定分隔符分割成列表。
str = "apple,banana,orange,grape"
print(str.split(",")) # 输出:['apple', 'banana', 'orange', 'grape']


  1. join():把列表中的字符串使用指定分隔符连接起来。
lst = ['apple', 'banana', 'orange', 'grape']
sep = ","
print(sep.join(lst)) # 输出:apple,banana,orange,grape


  1. startswith():判断字符串是否以指定子串开头。
str = "hello world"
print(str.startswith("hello")) # 输出:True


  1. startswith():判断字符串是否以指定子串开头。
str = "hello world"
print(str.startswith("hello")) # 输出:True


  1. endswith():判断字符串是否以指定子串结尾。
str = "hello world"
print(str.endswith("world")) # 输出:True


  1. find():查找指定子串在字符串中第一次出现的位置。
str = "hello world"
print(str.find("world")) # 输出:6


  1. count():统计指定子串在字符串中出现的次数。
str = "hello world"
print(str.count("l")) # 输出:3


  1. isdigit():判断字符串是否只包含数字字符。
str = "12345"
print(str.isdigit()) # 输出:True


  1. isalpha():判断字符串是否只包含字母字符。
str = "hello"
print(str.isalpha()) # 输出:True


  1. isalnum():判断字符串是否只包含字母和数字字符。
str = "hello123"
print(str.isalnum()) # 输出:True


  1. islower():判断字符串是否只包含小写字母。
str = "hello"
print(str.islower()) # 输出:True


  1. isupper():判断字符串是否只包含大写字母。
str = "HELLO"
print(str.isupper()) # 输出:True


  1. isspace():判断字符串是否只包含空格字符。
str = "    "
print(str.isspace()) # 输出:True
  1. startswith():判断字符串是否以指定子串开头。
str = "hello world"
print(str.startswith("hello")) # 输出:True


  1. endswith():判断字符串是否以指定子串结尾。
str = "hello world"
print(str.endswith("world")) # 输出:True


  1. encode():将字符串编码为指定格式的字节序列。
str = "你好世界"
print(str.encode("utf-8")) # 输出:b'\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c'


  1. decode():将指定格式的字节序列解码为字符串。
bytes = b'\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c'
print(bytes.decode("utf-8")) # 输出:你好世界


23.format():根据指定格式输出字符串。

name = "Tom"
age = 18
print("My name is {0} and I'm {1} years old".format(name, age)) # 输出:My name is Tom and I'm 18 years old
  1. isnumeric():判断字符串是否只包含数字字符。
str = "12345"
print(str.isnumeric()) # 输出:True


  1. isdecimal():判断字符串是否只包含十进制数字字符。
str = "12345"
print(str.isdecimal()) # 输出:True




总结


   字符串的定义:使用单引号、双引号或三重引号来定义一个字符串,例如:‘hello’、“world”、‘’‘This is a multiline string.’‘’

   字符串的连接(拼接):使用加号(+)或逗号(,)将两个字符串连接在一起。


   字符串的重复:使用乘号(*)将一个字符串重复多次。


   获取字符串长度:使用len()函数获取一个字符串的长度。


   获取字符串中的字符:使用索引可以获取字符串中某个位置上的字符,注意字符串是从0开始索引的。例如:s = “hello”,s[0]为’h’。


   字符串切片:使用[start🔚step]语法可以获取字符串的一个子串。start表示子串的起始位置,end表示子串的结束位置(不包含该位置处的字符),step表示步长,默认为1。例如:s = “hello”,s[1:4]为"ell"。


   字符串的分割:使用split()方法可以将一个字符串按照指定的分隔符进行分割成多个子串,并返回一个列表。例如:s = “hello world”,s.split(’ ')将返回[‘hello’, ‘world’]。


   字符串的替换:使用replace()方法可以将一个字符串中的某个子串替换成另一个字符串。例如:s = “hello world”,s.replace(‘world’, ‘python’)将返回"hello python"。


   字符串的查找:使用find()或index()方法可以查找一个字符串中某个子串的位置。find()方法返回子串第一次出现的位置,如果未找到则返回-1;index()方法也返回子串第一次出现的位置,但如果未找到会抛出异常。


   字符串的大小写转换:使用lower()、upper()、capitalize()等方法可以将一个字符串全部转换成小写、大写、首字母大写等形式。


   去除字符串两端的空格:使用strip()方法可以去除一个字符串两端的空格,lstrip()和rstrip()方法分别去除左侧和右侧的空格。


   字符串的格式化:使用format()方法可以将一些变量的值插入到一个格式化的字符串中。例如:“My name is {0}, I am {1} years old.”.format(“Tom”, 18)。


   判断字符串是否以指定的前缀或后缀开始/结束:使用startswith()和endswith()方法可以判断一个字符串是否以指定的前缀或后缀开始/结束。


   判断字符串是否由数字或字母构成:使用isdigit()和isalpha()方法可以判断一个字符串是否只由数字或字母构成。


在本篇博客中,我们深入探讨了 Python 字符串方法,并提供了丰富的示例。掌握这些字符串方法可以使我们更方便地操作和处理字符串。



相关文章
|
4天前
|
Python
【Python进阶(五)】——模块搜索及工作目录
【Python进阶(五)】——模块搜索及工作目录
|
4天前
|
索引 Python
python字符串(str)
【5月更文挑战第8天】
10 3
|
4天前
|
Python
【Python进阶(三)】——面向对象编程
【Python进阶(三)】——面向对象编程
|
4天前
|
Python
【Python进阶(一)】——异常与错误
【Python进阶(一)】——异常与错误
|
4天前
|
Python
【Python操作基础】——字符串
【Python操作基础】——字符串
|
1天前
|
Python
空间管理大师已上线!(2),Python高级工程师进阶学习】
空间管理大师已上线!(2),Python高级工程师进阶学习】
|
4天前
|
Python
Python注意字符串和字节字面量
【5月更文挑战第7天】Python注意字符串和字节字面量
15 4
|
4天前
|
数据可视化 数据挖掘 数据处理
【Python进阶(七)】——Series数据结构
【Python进阶(七)】——Series数据结构
|
4天前
|
Python
【Python进阶(六)】——随机数与数组
【Python进阶(六)】——随机数与数组
|
4天前
|
Python
【Python进阶(四)】——魔术命令
【Python进阶(四)】——魔术命令