【python】—— 字符串详解

简介: 【python】—— 字符串详解



(一)字符串的常用操作

在Python中,字符串是一种不可变的序列类型,用于表示文本数据。字符串是由字符组成的,可以包含字母、数字、特殊字符等。

  • len() 返回字符串的长度
str = "Hello, World!"
length = len(str)
print(length)  # 输出:13
  • lower() 和 upper() 分别将字符串转换为小写和大写
str = "Hello, World"
print(str.lower())  # 输出:hello, world
print(str.upper())  # 输出:HELLO, WORLD
  • capitalize() :将字符串的第一个字符转换为大写,并返回新字符串
str = "hello, world"
print((str.capitalize())) #输出: Hello, world
  • strip()、lstrip() 和 rstrip() 去除字符串两端左端右端的空格或指定字符
str = "   Hello, World   "
print(str.strip())        # 输出:"Hello, World"
print(str.lstrip())       # 输出:"Hello, World   "
print(str.rstrip())       # 输出:"   Hello, World"
  • find() 和 index() 查找子字符串在字符串中的位置
str = "   Hello, World   "
print(str.find("World"))    # 输出:10
print(str.index("World"))   # 输出:10
  • replace() 替换字符串中的子字符串
str = "Hello, World"
print(str.replace("World","Hello")) # 输出:Hello, Hello
  • center()将字符串居中,并使用指定字符(默认为空格)填充两侧的空白部分,使得字符串长度为指定宽度,并返回新字符串
str = "Hello,World"
print(str.center(20,'-'))    # 输出:----Hello,World-----
  • upper() 和 lower()将字符串中所有字母都转换成大写或者小写,并返回新字符串
str = "Hello,World"
print(str.upper())  # 输出:HELLO,WORLD
print(str.lower())  # 输出:hello,world
  • isupper() 和 islower()判断字符串中所有字母是否都是大写或者小写,并返回相应的布尔值。
str = "Hello,World"
print(str.isupper())     # 输出:False
print(str.islower())     # 输出:False

(二)格式化字符串

在Python中,格式化字符串是指将变量的值插入到字符串中,以方便输出。Python提供了三种主要的格式化字符串的方式:

2.1 占位符

位置参数格式化是通过占位符%实现的。可以在字符串中使用占位符%表示待插入的变量,然后使用元组作为参数,将元组中的变量传递给占位符.

  • 示例如下:
name = "zhangsan"
age = 20
formatted_string = "My name is %s and I am %d years old." % (name, age)
print(formatted_string)

输出展示:

其次在占位符%后面,可以用以下字符指定数据类型和格式:

  • %d:整数类型
  • %f:浮点数类型
  • %s:字符串类型
  • %x:十六进制整数类型

2.2 f-string

f-string 是Python 3.6及以上版本新增的一种字符串格式化方式。在f-string 中,可以在字符串前加上字母f,然后在字符串中使用花括号{}表示待插入的变量。

  • 示例如下:
name = "zhangsan"
age = 20
print(f"My name is {name} and I'm {age} years old.")

输出展示:


2.3 格式化函数format()

可以使用字符串的format()方法将变量值插入到字符串中。在字符串中,可以使用一对花括号{}表示待插入的变量,然后使用format()方法将变量传递给花括号。

  • 示例如下:
name = "zhangsan"
age = 20
print("My name is {} and I'm {} years old.".format(name, age))

输出展示:


(三)字符串的编码和解码

首先大家需要理解为什么需要进行编码和解码操作:

【解释说明】

  • 在Python中,字符串的编码和解码涉及到将文本数据转换为字节数据(编码)以及将字节数据转换回文本数据(解码);
  • 符串的编码和解码是指将字符串与字节之间相互转换的过程。编码是将字符串转换为字节序列,而解码是将字节序列转换为字符串。

3.1 字符串编码

字符串转换为字节序列称为编码。在Python中,常用的字符串编码方式包括ASCII、UTF-8、UTF-16

  • 在Python中,字符串默认使用UTF-8编码在解码时,可能会遇到无法解码的字节序列,可以使用errors参数处理

  • 当然也可以使用gbk进行编码操作:


3.2 字符串解码

将字节序列转换为字符串称为解码。在Python中,可以使用decode()方法将字节序列解码为字符串。

  • 解码UTF-8编码的字节序列:
str = "你好"
encoded_str = str.encode(errors='replace') #默认是utf-8,因为utf-8中文占3个字节
print(encoded_str)
#1.使用bytes->str操作
print(bytes.decode(encoded_str,'utf-8'))
#2.解码utf-8编码的字节序列
str2 = b'\xe4\xbd\xa0\xe5\xa5\xbd'
print(str2.decode('utf-8'))

输出展示:

  • 解码gbk编码的字节序列:
str = "你好"
gbk_str = str.encode('gbk',errors='replace') #因为gbk中文占2个字节
print(gbk_str)
#1.使用bytes->str操作
print(bytes.decode(gbk_str,'gbk'))
#2.解码gbk编码的字节序列
str2 = b'\xc4\xe3\xba\xc3'
print(str2.decode('gbk'))

3.3 处理异常

  • 1.当处理异常时 errors = replace 时,会替换成

  • 2.当处理异常时 errors = ignore 时,编译器会忽略报错的情况

  • 3.当处理异常时 errors = strict时,编译器会报错

【小结】

  • 在进行字符串编码和解码时,需要确保使用相同的编码方式。
  • 如果尝试使用错误的编码方式对字节序列进行解码,会引发UnicodeDecodeError错误。
  • 如果尝试使用错误的编码方式对字符串进行编码,会引发UnicodeEncodeError错误。

(四)数据处理操作

4.1 字符串的拼接

  • 使用直接拼接的方法:
print('hello''world')
  • 可以使用 + 运算符将两个字符串连接起来:
str1 = "Hello"
str2 = "World"
print(str1 + str2)
  • 也可以使用字符串的 join() 方法:
str1 = "Hello"
str2 = "World"
print("".join([str1,str2]))
  • 使用格式化字符串进行拼接操作:
str1 = "Hello"
str2 = "World"
# 使用格式化字符串拼接的三种方法
print('%s%s' % (str1,str2))
print(f'{str1}{str2}')
print('{0}{1}'.format(str1,str2))

4.2 字符串的去重

  • 可用通过字符串拼接以及not in操作达到去重效果:
str = "helloworldhelloabcgdfoefpa"
#1.字符串拼接以及not in
new_str_1 = ""
for item in str:
    if item not in new_str_1:
        new_str_1 += item #拼接操作
print(new_str_1)
  • 可用通过索引 + not in操作 :
str = "helloworldhelloabcgdfoefpa"
#2.索引 + not in操作
new_str_2 = ""
for i in range(len(str)):
    if str[i] not in new_str_2:
        new_str_2 += str[i]
print(new_str_2)
  • 还可以通过集合去重+列表排序:
str = "helloworldhelloabcgdfoefpa"
#3.通过集合去重+列表排序
new_str_3 = set(str)
lst = list(new_str_3)
lst.sort(key=str.index)
print(''.join(lst))

输出结果如下:


(五)小结

Python字符串是不可变序列,在Python中通过一对单引号或双引号来表示。字符串可以进行切片和索引等操作,常见的字符串方法很多,大家会用即可!!

相关文章
|
23天前
|
Python
在 Python 中,如何将日期时间类型转换为字符串?
在 Python 中,如何将日期时间类型转换为字符串?
119 64
|
4月前
|
存储 算法 数据库
使用python hashlib模块给明文字符串加密,以及如何撞库破解密码
`hashlib` 是 Python 中用于实现哈希功能的模块,它可以将任意长度的输入通过哈希算法转换为固定长度的输出,即散列值。该模块主要用于字符串加密,例如将用户名和密码转换为不可逆的散列值存储,从而提高安全性。`hashlib` 提供了多种哈希算法,如 `md5`、`sha1`、`sha256` 等。
68 1
|
15天前
|
存储 测试技术 Python
Python 中别再用 ‘+‘ 拼接字符串了!
通过选择合适的字符串拼接方法,可以显著提升 Python 代码的效率和可读性。在实际开发中,根据具体需求和场景选择最佳的方法,避免不必要的性能损失。
38 5
|
19天前
|
Python
使用Python计算字符串的SHA-256散列值
使用Python计算字符串的SHA-256散列值
24 7
|
25天前
|
Python
在 Python 中,如何将字符串中的日期格式转换为日期时间类型?
在 Python 中,如何将字符串中的日期格式转换为日期时间类型?
32 6
|
2月前
|
Python
【10月更文挑战第6天】「Mac上学Python 11」基础篇5 - 字符串类型详解
本篇将详细介绍Python中的字符串类型及其常见操作,包括字符串的定义、转义字符的使用、字符串的连接与格式化、字符串的重复和切片、不可变性、编码与解码以及常用内置方法等。通过本篇学习,用户将掌握字符串的操作技巧,并能灵活处理文本数据。
60 1
【10月更文挑战第6天】「Mac上学Python 11」基础篇5 - 字符串类型详解
|
3月前
|
Python
python获取字符串()里面的字符
在Python中,如果你想获取字符串中括号(比如圆括号`()`、方括号`[]`或花括号`{}`)内的字符,你可以使用正则表达式(通过`re`模块)或者手动编写代码来遍历字符串并检查字符。 这里,我将给出使用正则表达式的一个例子,因为它提供了一种灵活且强大的方式来匹配复杂的字符串模式。 ### 使用正则表达式 正则表达式允许你指定一个模式,Python的`re`模块可以搜索字符串以查找匹配该模式的所有实例。 #### 示例:获取圆括号`()`内的内容 ```python import re def get_content_in_parentheses(s): # 使用正则表达
115 36
|
2月前
|
自然语言处理 Java 数据处理
【速收藏】python字符串操作,你会几个?
【速收藏】python字符串操作,你会几个?
61 7
|
2月前
|
索引 Python
Python 高级编程:深入探索字符串切片
在Python中,字符串切片功能强大,可灵活提取特定部分。本文详细介绍切片技巧:基本切片、省略起始或结束索引、使用负数索引、设定步长及反转字符串等。此外,还介绍了如何结合其他操作进行切片处理,如先转换大小写再提取子串。 来源:https://www.wodianping.com/yeyou/2024-10/48238.html
46 4
|
3月前
|
Python
python第三方库-字符串编码工具 chardet 的使用(python3经典编程案例)
这篇文章介绍了如何使用Python的第三方库chardet来检测字符串的编码类型,包括ASCII、GBK、UTF-8和日文编码的检测示例。
156 6
下一篇
DataWorks