1.1.1字符串和文本处理的相关模块
1.python标准库中的字符串和文本处理相关模块
string模块:包含若干字符集常量,其处理字符串的函数已经被字符串对象的方法代替。
re模块:正则表达式处理
codecs模块:字符编码处理
difflib模块:比较字符串列表的差异
gettext模块:语言国际化
textwrap模块:格式化文本段落
unicodedata模块:unicode字符库
2.自然语言处理模块库(NLTK)
NLTK是Python用于自然语言处理(natural language processing,NLP)的第三方库,使用NLTK可以完成很多自然语言处理的任务,包括分词,词性标注,命名实体识别及句法分析等。
1.1.2.字符串处理的常用方法
使用str对象提供的方法:可以实现常用的字符串处理功能
使用正则表达式:匹配和查找字符串并对其进行相应的修改处理。
使用专用的第三方库文本处理模块(NLTK)
1.1.3字符串的测试,查找,替换
str对象包括如下用于字符串测试,查找,替换的方法
str.startswith(prefix[,start[,end]]):是否以prefix开头
str.endswith(suffix[,start[,end]]):是否以suffix结尾
str.count(sub[,start[,end]]):返回指定字符串出现的次数
str.index(sub[,start[,end]]):搜索指定字符串,返回下标,没有则导致ValueError
str.rindex(sub[,start[,end]]):从右边开始搜索指定字符串,返回下标,没有则导致ValueError
str.find(sub[,start[,end]]):
字符串,返回下标,没有则返回-1
str.rfind(sub[,start[,end]]):从右边开始搜索指定字符串,返回下标,没有则导致-1
str.replace(old,new[,count]):替换old为new,可选count为替换次数。
1.1.4字符串的翻译和转换
str对象包括如下用于字符串翻译和转换的方法
static str.maketrans(x,y[,z]):创建用于translate的转换表
str.translate(map):根据map转换
这里做简单的实例:
table=str.maketrans('1234567','一二三四五六日') s1='1 3 4 9' print(s1.translate(table)) #运行结果:一 三 四 9
这个差不多的意思也就是找对应的字符串