目录
字典函数:
列表函数:
字符串函数:
format()格式符:
random函数
jieba库
字典函数:
items() 将字典转换成列表
Python 字典(Dictionary) items() 函数以列表返回可遍历的(键, 值) 元组数组。
dict.items()
stud={'sid': '103', 'Chinese': 90}
sv=stud.items()
print(sv)
for i in sv:
print(i)
可以用这种方式将字典转为字符串:
get()函数:
利用get()函数来获取字典键的值
例:
返回key的value
dict.get(key)
若指定的key键不存在,则返回设置的返回值0,若没设置返回值,则返回None
dict.get(key,0)
列表函数:
sort() 将列表按升序或降序排列
reverse=False 升序排列(默认),reverse=Ture 降序排列
默认情况下,sort() 方法对列表进行升序排序。
list.sort()
lst=[1,0,8,6,1,1]
lst.sort()
print(lst)
字符串函数:
replace()函数:
将旧字符串换成新的字符串,第三个参数指定替换次数,最多替换几次。
str.replace(old, new[, max])
可以利用这个函数将文章中的标点符号去除。
txt = open("命运.txt",encoding="UTF-8").read()
for ch in ",。?:":
txt=txt.replace(ch,"")
split()函数:
str.split()
用 split(',') 来从字符串里提取所输入的字符,split() 函数返回列表
strip()函数:
strip()用于移除字符串头尾的指定字符(默认空格或换行符)或字符序列。可以和split()函数组合使用:
ls=str(line,encoding="utf-8").strip(' \r\n').split(',')
注意:该方法只删除开头或结尾的字符,不能删除中间部分的字符。
join函数:
str.join()
字符串方法 str.join(ls) ,把列表里的各个元素,用 str 的内容连接起来。利用了空字符串‘ ’,来调用这个函数,将带有逗号的字符串变换成了没有逗号的字符串
ls = input().split(",") # 请输入一个字符串,由逗号隔开每个字符
print(ls)
print("".join(ls))
字符串全部单词大写、小写、首字母大写
upper(): 字符串中全部单词大写
lower(): 字符串中全部单词小写
title(): 字符串中每个单词的首字母大写, 其余小写, 非字母后第一个字母将转为大写
capitalize(): 字符串中首字母大写, 其余小写, 非字母后第一个字母还是小写
使用方法:
源字符串:
w = "100hello WORLD"
w.upper()
'100HELLO WORLD'
w.lower()
'100hello world'
w.title()
'100Hello World'
w.capitalize()
'100hello world'
format()格式符:
基本语法是通过 {} 和 : 来代替以前的 % 。
format 函数可以接受不限个参数,位置可以不按顺序。
例题:
解释:
format() 方法的格式控制的语法格式如下:
{<参数序号>:<格式控制标记>}
格式控制标记包括:<填充><对齐><宽度><,><.精度><类型>等六个字段,这些字段都是可选的,可以组合使用。
填充常跟对齐一起使用,^、<、> 分别是居中、左对齐、右对齐,后面带宽度,引导符号 ':' 后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充。
所以填充字符为 @,宽度为 10,精度为 6,也就是字符串最大输出长度为 6。Fog 长度为 3,可以正常输出。>表示右对齐,所以输出结果为 @@@@@@@Fog。
输出十六进制、八进制、二进制表示形式
从键盘输入一个整数,在屏幕上显示输出该整数的十六进制、八进制、二进制表示形式
Tempstr = eval(input())
print("0x{0:x},0o{0:o},0b{0:b}".format(Tempstr))
random函数
random函数不能直接使用,需要import导入
random.seed() 设置改变随机数生成器的种子
如果不设置种子,每次运行代码都会随机生成别的数,设置了种子之后,结果就会固定,每次都会随机生成这个数,种子可以是任意整数。
不设置种子
import random
print(random.randint(1,100))
设置种子
import random
random.seed(6)
print(random.randint(1,100))
#不设置种子的结果:
#设置种子的结果:
random.randint() 生成随机正整数
random.uniform() 生成随机浮点数
生成随机正整数和随机浮点数:
import random
for i in range(3):
z=random.randint(1,100) #生成1~100随机整数
print(z)
for i in range(3):
f=random.uniform(1,100) #生成1~100随机浮点数
print(f)
jieba库
支持三种分词模式:
精确模式:试图将句子最精确地切开,适合文本分析;
全模式:把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;
搜索引:擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
encoding=utf-8
import jieba
seg_list = jieba.cut("我来到北京清华大学", cut_all=True)
print("Full Mode: " + "/ ".join(seg_list)) # 全模式
seg_list = jieba.cut("我来到北京清华大学", cut_all=False)
print("Default Mode: " + "/ ".join(seg_list)) # 精确模式
默认是精确模式