删除字符串中的指定符号
s = "abc123,123。" # 删除逗号 s = s.replace(',', '') print(s) # "abc123123。"
删除字符串中的空格
s = " 123abc " # 删除开头的空格 print(s.lstrip()) # "123 abc " # 删除结尾的空格 print(s.rstrip()) # " 123 abc" # 删除开头和结尾的空格 print(s.strip()) # "123 abc" # 删除字符串中所有的空格 print(s.replace(' ', '')) # "123abc"
删除字符串中的所有符号,只保留数字和英文字母
import re s = "123,abc .?/&?》^_^dddA。" # 把所有编码非\u0030-\u0039(数字)、\u0041-\u007a(英文字母)的字符替换为空字符串 rs = re.sub("([^\u0030-\u0039\u0041-\u007a])", '', s) print(rs) # "123abcdddA"
只字符串中的保留汉字
import re s = "我爱中国🇨🇳,I love China。" # 把所有编码非\u4e00-\u9fa5(汉字)的字符替换为空字符串 rs = re.sub("([^\u4e00-\u9fa5])", '', s) print(rs) # "我爱中国"
对应的unicode编码范围
说明 unicode范围 数字 \u0030-\u0039 汉字 \u4e00-\u9fa5 大写字母 \u0041-\u005a 小写字母 \u0061-\u007a 英文字母 \u0041-\u007a 韩文 \uAC00-\uD7AF 日文 \u3040-\u31FF