random
random模块用于生成伪随机数。
真正意义上的随机数(或者随机事件)是按照实验过程中表现的分布概率随机产生的,其结果是不可预测的。而计算机中的随机数是所谓的随机函数按照一定算法模拟产生的,其结果是确定的,是可预测的。所以用计算机随机函数所产生的“随机数”并不随机,是伪随机数,绝对不可以用来生成密码。
1.计算机的伪随机数是由随机种子根据一定的计算方法计算出来的数值。所以,只要计算方法一定,随机种子一定,那么产生的随机数就是固定的。
2.如果用户不设置随机种子,那么随机种子默认来自系统时钟。
基本方法
random.seed(a=None, version=2)
初始化随机数生成器。如果未提供a或者a=None,则使用系统时间为种子。如果a是一个整数,则作为新的种子。
random.getstate()
返回当前生成器的内部状态
random.setstate(state)
传入一个先前利用getstate方法获得的状态对象,使得生成器恢复到这个状态。
random.getrandbits(k)
返回一个不大于K位的Python整数(十进制),比如k=10,则结果是0~2^10之间的整数。
针对整数的方法
注意:在使用后面的方法时,一定要小心区间的开闭!
random.randrange(stop)
random.randrange(start, stop[, step])
等同于后面的choice(range(start,stop,step)),从range的范围内随机选择一个整数。这个方法并不实际创建range对象。
random.randint(a, b)
返回一个a <= N <= b的随机整数N。等同于randrange(a, b+1)。
针对序列类型的方法
random.choice(seq)
从非空序列seq中随机选取一个元素。如果seq为空则弹出IndexError异常。
random.choices(population, weights=None, *, cum_weights=None, k=1)
3.6版本新增。从population集群中随机抽取K个元素。weights是相对权重列表,cum_weights是累计权重,两个参数不能同时存在。
random.shuffle(x[, random])
随机打乱序列x内元素的排列顺序,俗称“洗牌”。只能用于可变的序列,对于不可变序列,请使用下面的sample()方法om.sample(population, k)
从population样本或集合中随机抽取K个不重复的元素形成新的序列。常用于不重复的随机抽样。返回的是一个新的序列,不会破坏原有序列。比如从一个整数区间随机抽取一定数量的整数random.sample(range(10000000), k=60),这非常有效和节省空间。 如果k大于population的长度,则弹出ValueError异常。
案例
from random import *
random() # 随机浮点数: 0.0 <= x < 1.0
0.37444887175646646
uniform(2.5, 10.0) # 随机浮点数: 2.5 <= x < 10.0
3.1800146073117523
randrange(10) # 0-9的整数:
7
randrange(0, 101, 2) # 0-100的偶数
26
choice([‘win’, ‘lose’, ‘draw’]) # 从序列随机选择一个元素
‘draw’
deck = ‘ace two three four’.split()
shuffle(deck) # 对序列进行洗牌,改变原序列
deck
[‘four’, ‘two’, ‘ace’, ‘three’]
lis = [i for i in range(10)]
sample(lis, k=4) # 不改变原序列的抽取指定数目样本,并生成新序列
[40, 10, 50, 30]
下面是生成一个包含大写字母A-Z和数字0-9的随机4位验证码的程序
import random
checkcode = ‘’
for i in range(4):
current = random.randrange(0,4)
if current != i:
temp = chr(random.randint(65,90))
else:
temp = random.randint(0,9)
checkcode += str(temp)
print(checkcode)
下面是生成指定长度字母数字随机序列的代码:
import random, string
def gen_random_string(length):
数字的个数随机产生
num_of_numeric = random.randint(1,length-1)
剩下的都是字母
num_of_letter = length - num_of_numeric
随机生成数字
numerics = [random.choice(string.digits) for i in range(num_of_numeric)]
随机生成字母
letters = [random.choice(string.ascii_letters) for i in range(num_of_letter)]
结合两者
all_chars = numerics + letters
洗牌
random.shuffle(all_chars)
生成最终字符串
result = ‘’.join([i for i in all_chars])
return result
if name == ‘main’:
print(gen_random_string(64))
如何统计序列中元素的出现频度
1.某随机序列[1,3,7,7,5,4,3]中,找到出现次数最高的3个元素,它们出现次数是多少?
from random import randint
data = [randint(0,20) for _ in range(30)]
c = dict.fromkeys(data,0) # 生成已data值为key,以0位值得字典。
for x in data:
c[x] += 1 # 如果值出现就加一
sorted(c.items(), key=lambda d: d[1],reverse=True)[:3]
from collections import Counter
c2 = Counter(data)
c2.most_common(3) # 返回3个出现次数最多的
2.对某英文文章的单词,进行词频统计,找到出现次数最高的10个单词,它们出现次数是多少?
f = open(‘filename.txt’,‘r’)
txt = f.read()
c3 = Counter(re.split(‘\W+’,txt))
c3.most_common(10)