源码请到:自然语言处理练习: 学习自然语言处理时候写的一些代码 (gitee.com)
一、字符串处理
这里是一些自然语言中常用的python字符串操作,python内置无需安装
1.1 strip函数:去掉首尾特定字符
示例:
text=" abcdef125s wr2258abcd "print("base", text) print("strip:", text.strip(" "))
1.2 rstrip函数和lstrip函数:去掉右边特定字符和去掉左边特定字符
示例:
print("lstrip:", text.lstrip(" ")) print("rstrip:", text.rstrip(" "))
1.3 replace函数:替换特定字符字串,可以传入参数确定替换字串的个数
示例:
print("replace:", text.replace('a', 'A')) print("replace:", text.replace('a', 'A', 1))
1.4 find函数:查找子串返回字串的下标位置,如果没有返回-1
示例:
print("find:", text.find('a'))
1.5 isalpha函数和isdigit函数:判断字符串是否全为字母和判断字符串是否全为数字
示例:
print("isalpha:", "abc -", "abc".isalpha(), "123 -", "123".isalpha(), "a123 -", "a123".isalpha()) print("isdigit:", "abc -", "abc".isdigit(), "123 -", "123".isdigit(), "a123 -", "a123".isdigit())
1.6 split函数:按照字串分割字符串
示例:
text2="a,d,dw,d,s,w,t,c,w,"list1=text2.split(',') print("base:", text2) print("split:", list1)
1.7 join函数:将字串列表按照特定字符间隔合并起来
示例:
print("join:", ",".join(list1))