python——字符串

简介: raw字符串(原始字符串)所见即所得,例如print('\n')print(r'\n')\nlen('\n')1len(r'\n')2Unicode 字符串ASCII码:每个字符都是以7位二进制数的方式存储在计算机内,ASCI字符只能表示95个可打印字符。

raw字符串(原始字符串)

所见即所得,例如

print('\n')
print(r'\n')
\n
len('\n')
1
len(r'\n')
2

Unicode 字符串

  • ASCII码:每个字符都是以7位二进制数的方式存储在计算机内,ASCI字符只能表示95个可打印字符。
  • Unicode:通过使用一个或多个字节来表示一个字符的方式突破了ASCII码的限制。

示例:

'\nabc'
'\nabc'
u'\nabc'
'\nabc'
u'刘备'
'刘备'
U'卓越'
'卓越'

Python转义字符

在需要在字符中使用特殊字符时,python用反斜杠(\)转义字符。如下表:

转义字符 描述
\(在行尾时) 续行符
\\ 反斜杠符号
\' 单引号
\" 双引号
\a 响铃
\b 退格(Backspace)
\e 转义
\000
\n 换行
\v 纵向制表符
\t 横向制表符
\r 回车
\f 换页
\oyy 八进制数,yy代表的字符,例如:\o12代表换行
\xyy 十六进制数,yy代表的字符,例如:\x0a代表换行

格式化操作

python字符串格式化符号:

符   号 描述
%c 转换成字符(ASCII码值或长度为1的字符串)
%s 优先使用str()函数进行字符串转换
%r 优先使用repr()函数进行字符串转换
%u 转换为无符号十进制
%d 转换为有符号十进制
%o 转换为无符号八进制数
%x/%X 转换为无符号十六进制数
%f 转换为浮点数字,可指定小数点后的精度
%e/%E 用科学计数法格式化浮点数
%g %f和%e的简写
%G %f%E 的简写
%p 用十六进制数格式化变量的地址
%% 输出%

格式化操作符辅助指令:

符号 功能
* 定义宽度或者小数点精度
- 用做左对齐
+ 在正数前面显示加号(+ )
<sp> 在正数前面显示空格
# 在八进制数前面显示零('0'),在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
0 显示的数字前面填充'0'而不是默认的空格
% '%%'输出一个单一的'%'
(var) 映射变量(字典参数)
m.n. m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话)

形式:
format%values

values的输入形式:

  • 元组形式
  • 字典形式(键作为format出现,字典作为values存在)
print('hello %s, %s enough!'%('world','happy'))
hello world, happy enough!
print('int:%d,str:%s,str:%s'%(1.0,['in list','i am list'],'i am str'))
int:1,str:['in list', 'i am list'],str:i am str
'%x'%100
'64'
'%X'%110
'6E'
'we are at %d%%'%100
'we are at 100%'
'%s is %d years old'%('Li',20)
'Li is 20 years old'
for i in range(1000,10000):
    a=int(i/1000)
    b=int(i/100)%10
    c=(int(i/10))%10
    d=i%10
    if a**4+b**4+c**4+d**4==i:
        print('%d=%d^4+%d^4+%d^4+%d^4'%(i,a,b,c,d))
1634=1^4+6^4+3^4+4^4
8208=8^4+2^4+0^4+8^4
9474=9^4+4^4+7^4+4^4

m.n 宽度与精度

'%.3f'%123.12345
'123.123'
'%.5s'%'hello world'
'hello'
'%+d'%4
'+4'
'%+d'%-4
'-4'
from math import pi
'%-10.2f'%pi
'3.14      '
'%10.4f'%pi
'    3.1416'
'My name is %(name)s,age is %(age)d,gender is %(gender)s'%{'name':'LiMing','age':28,'gender':'male'}
'My name is LiMing,age is 28,gender is male'

字符串模板

字符串对象Template对象存在与string模块中:

  • 使用美元符号$定义代替换的参数
  • 使用substitute()方法(缺少参数时会报错,KeyError异常) & safe_substitute()方法(缺少key时,直接显示参数字符串)进行参数替换

示例:

from string import Template
s=Template('There are ${how_many} nodes in the ${tree}')
print(s.substitute(how_many=32,tree='splay_tree'))
There are 32 nodes in the splay_tree
print(s.substitute(how_many=32))
---------------------------------------------------------------------------

KeyError                                  Traceback (most recent call last)

<ipython-input-4-6c5e84463638> in <module>()
----> 1 print(s.substitute(how_many=32))


D:\ProgramData\Anaconda3\lib\string.py in substitute(*args, **kws)
    124             raise ValueError('Unrecognized named group in pattern',
    125                              self.pattern)
--> 126         return self.pattern.sub(convert, self.template)
    127 
    128     def safe_substitute(*args, **kws):


D:\ProgramData\Anaconda3\lib\string.py in convert(mo)
    117             named = mo.group('named') or mo.group('braced')
    118             if named is not None:
--> 119                 return str(mapping[named])
    120             if mo.group('escaped') is not None:
    121                 return self.delimiter


KeyError: 'tree'
from string import Template
s=Template('There are ${how_many} nodes in the ${tree}')
print(s.safe_substitute(how_many=32))
There are 32 nodes in the ${tree}

Python 的字符串常用内建函数

1 S.capitalize() 返回一个首字母大写的字符串(str):

a = "this is string example from runoob...wow!!!"
print ("a.capitalize() : ", a.capitalize())
a.capitalize() :  This is string example from runoob...wow!!!

2 S.lower -> Return a copy of the string S converted to lowercase

'HGKFKF'.lower()
'hgkfkf'

3 S.center(width[, fillchar])

参数:

  • width:字符串的总宽度
  • fillchar填充字符(默认为空格)

返回值:

  • 一个指定的宽度width居中的字符串
  • 如果width小于字符串宽度直接返回字符串,否则使用fillchar去填充
st = "[www.runoob.com]"
print ("st.center(40, '%') : ", st.center(40, '%'))
st.center(40, '%') :  %%%%%%%%%%%%[www.runoob.com]%%%%%%%%%%%%

4 S.count(sub[, start[, end]]) 该方法返回子字符串在字符串中出现的次数

  • sub -- 搜索的子字符串
  • start -- 字符串开始搜索的位置。默认为第一个字符。
  • end -- 字符串中结束搜索的位置。默认为字符串的最后一个位置。
st="www.runoob.com"
sub='o'
print ("st.count('o') : ", st.count(sub))

sub='run'
print ("st.count('run', 0, 10) : ", st.count(sub,0,10))
st.count('o') :  3
st.count('run', 0, 10) :  1

5 bytes.decode(self, /, encoding='utf-8', errors='strict')

  • encoding -- 要使用的编码,如"UTF-8"。
  • errors -- 设置不同错误的处理方案。默认为'strict',意为编码错误引起一个UnicodeError。 其他可能得值有 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 以及通过 codecs.register_error() 注册的任何值。

返回该方法返回解码后的字符串。

6 S.encode(encoding='utf-8', errors='strict') -> bytes

Python3 中str没有decode方法,但是可以使用bytes对象的decode()方法来解码给定的bytes对象,这个bytes对象可以由str.encode()来编码返回。

s = "中国"
s_utf8 = s.encode("UTF-8")
s_gbk = s.encode("GBK")

print(s)

print("UTF-8 编码:", s_utf8)
print("GBK 编码:", s_gbk)

print("UTF-8 解码:", s_utf8.decode('UTF-8','strict'))
print("GBK 解码:", s_gbk.decode('GBK','strict'))
中国
UTF-8 编码: b'\xe4\xb8\xad\xe5\x9b\xbd'
GBK 编码: b'\xd6\xd0\xb9\xfa'
UTF-8 解码: 中国
GBK 解码: 中国

7 S.find(sub[, start[, end]]) -> int

如果包含子字符串返回开始的索引值,否则返回-1。

str1 = "Runoob example....wow!!!"
str2 = "exam";
 
print (str1.find(str2))
print (str1.find(str2, 5))
print (str1.find(str2, 10))
7
7
-1
info = 'abca'
print(info.find('a'))      # 从下标0开始,查找在字符串里第一个出现的子串,返回结果:0

print(info.find('a', 1))   # 从下标1开始,查找在字符串里第一个出现的子串:返回结果3

print(info.find('3'))      # 查找不到返回-1
0
3
-1

8 S.join(iterable) -> str

Return a string which is the concatenation of the strings in the
iterable.

关于iterable参考python——聊聊iterable,sequence和iterators

s1 = "-"
s2 = ""
seq = ("r", "u", "n", "o", "o", "b") # 字符串序列
print (s1.join( seq ))
print (s2.join( seq ))
r-u-n-o-o-b
runoob

9 S.strip([chars]) -> str

  • Return a copy of the string S with leading and trailing whitespace removed.
  • If chars is given and not None, remove characters in chars instead.
st = "     this is string example....wow!!!     ";
print( st.lstrip() );
st = "88888888this is string example....wow!!!8888888";
print( st.lstrip('8') );
print( st.strip('8') );
this is string example....wow!!!     
this is string example....wow!!!8888888
this is string example....wow!!!

10 S.replace(old, new[, count]) -> str

  • Return a copy of S with all occurrences of substring old replaced by new.
  • If the optional argument count is given, only the first count occurrences are replaced.
st = "www.w3cschool.cc"
print ("菜鸟教程新地址:", st)
print ("菜鸟教程新地址:", st.replace("w3cschool.cc", "runoob.com"))

st = "this is string example....wow!!!"
print (st.replace("is", "was", 3))
菜鸟教程新地址: www.w3cschool.cc
菜鸟教程新地址: www.runoob.com
thwas was string example....wow!!!

11 S.split(sep=None, maxsplit=-1) -> list of strings

  • Return a list of the words in S, using sep as the delimiter string.
  • If maxsplit is given, at most maxsplit splits are done.
  • If sep is not specified or is None, any whitespace string is a separator and empty strings are removed from the result.
st = "this is string example....wow!!!"
print (st.split( ))
print (st.split('i',1))
print (st.split('w'))
['this', 'is', 'string', 'example....wow!!!']
['th', 's is string example....wow!!!']
['this is string example....', 'o', '!!!']
探寻有趣之事!
目录
相关文章
|
24天前
|
Python
在 Python 中,如何将日期时间类型转换为字符串?
在 Python 中,如何将日期时间类型转换为字符串?
119 64
|
4月前
|
存储 算法 数据库
使用python hashlib模块给明文字符串加密,以及如何撞库破解密码
`hashlib` 是 Python 中用于实现哈希功能的模块,它可以将任意长度的输入通过哈希算法转换为固定长度的输出,即散列值。该模块主要用于字符串加密,例如将用户名和密码转换为不可逆的散列值存储,从而提高安全性。`hashlib` 提供了多种哈希算法,如 `md5`、`sha1`、`sha256` 等。
68 1
|
16天前
|
存储 测试技术 Python
Python 中别再用 ‘+‘ 拼接字符串了!
通过选择合适的字符串拼接方法,可以显著提升 Python 代码的效率和可读性。在实际开发中,根据具体需求和场景选择最佳的方法,避免不必要的性能损失。
38 5
|
20天前
|
Python
使用Python计算字符串的SHA-256散列值
使用Python计算字符串的SHA-256散列值
24 7
|
26天前
|
Python
在 Python 中,如何将字符串中的日期格式转换为日期时间类型?
在 Python 中,如何将字符串中的日期格式转换为日期时间类型?
33 6
|
2月前
|
Python
【10月更文挑战第6天】「Mac上学Python 11」基础篇5 - 字符串类型详解
本篇将详细介绍Python中的字符串类型及其常见操作,包括字符串的定义、转义字符的使用、字符串的连接与格式化、字符串的重复和切片、不可变性、编码与解码以及常用内置方法等。通过本篇学习,用户将掌握字符串的操作技巧,并能灵活处理文本数据。
61 1
【10月更文挑战第6天】「Mac上学Python 11」基础篇5 - 字符串类型详解
|
3月前
|
Python
python获取字符串()里面的字符
在Python中,如果你想获取字符串中括号(比如圆括号`()`、方括号`[]`或花括号`{}`)内的字符,你可以使用正则表达式(通过`re`模块)或者手动编写代码来遍历字符串并检查字符。 这里,我将给出使用正则表达式的一个例子,因为它提供了一种灵活且强大的方式来匹配复杂的字符串模式。 ### 使用正则表达式 正则表达式允许你指定一个模式,Python的`re`模块可以搜索字符串以查找匹配该模式的所有实例。 #### 示例:获取圆括号`()`内的内容 ```python import re def get_content_in_parentheses(s): # 使用正则表达
115 36
|
2月前
|
自然语言处理 Java 数据处理
【速收藏】python字符串操作,你会几个?
【速收藏】python字符串操作,你会几个?
61 7
|
2月前
|
索引 Python
Python 高级编程:深入探索字符串切片
在Python中,字符串切片功能强大,可灵活提取特定部分。本文详细介绍切片技巧:基本切片、省略起始或结束索引、使用负数索引、设定步长及反转字符串等。此外,还介绍了如何结合其他操作进行切片处理,如先转换大小写再提取子串。 来源:https://www.wodianping.com/yeyou/2024-10/48238.html
46 4
|
3月前
|
Python
python第三方库-字符串编码工具 chardet 的使用(python3经典编程案例)
这篇文章介绍了如何使用Python的第三方库chardet来检测字符串的编码类型,包括ASCII、GBK、UTF-8和日文编码的检测示例。
156 6