numpy的数组生成方法是比较多的,大体分为以下几种:
1,生成0和1的整数数组
2,根据现有数据生成数组
3,生成固定范围的数组
4,生成随机数组
现在就以上面的四种方法一一演示。
一,
0和1的整数数组
新建一个8行3列的数据全部是用0填充的二维数组:
import numpy as np a = np.zeros(shape=(8,3),dtype="f2") print(a,a.ndim)
结果如下:
[[0. 0. 0.] [0. 0. 0.] [0. 0. 0.] [0. 0. 0.] [0. 0. 0.] [0. 0. 0.] [0. 0. 0.] [0. 0. 0.]] 2
新建一个4行3列的数据全部是用1填充的二维数组:
b = np.ones(shape=(4,3),dtype="f4") print(b,b.ndim)
结果如下:
[[1. 1. 1.] [1. 1. 1.] [1. 1. 1.] [1. 1. 1.]] 2
二,现有数组生成nparry
例如,有一个成绩表,该表为list:
score=([[80, 89, 86, 67, 79] , [78, 97, 89, 67, 81], [90, 94, 78, 67, 74] , [91, 91, 90, 67, 69] , [76, 87, 75, 67, 86], [70, 79, 84, 67, 84] , [94, 92, 93, 67, 64], [86, 85, 83, 67, 80]]) print(score,type(score))
结果如下:
[[80, 89, 86, 67, 79], [78, 97, 89, 67, 81], [90, 94, 78, 67, 74], [91, 91, 90, 67, 69], [76, 87, 75, 67, 86], [70, 79, 84, 67, 84], [94, 92, 93, 67, 64], [86, 85, 83, 67, 80]] <class 'list'>
将其转为nparray:
data1 = np.array(score) print(data1,type(data1))
浅拷贝方式:
data2 = np.asarray(score) print(data2,type(data2))
深拷贝方式:
data3 = np.copy(score) print(data3,type(data3))
三,
生成固定范围的数组(该方法非常常用)
比如,生成0到10之间的100个数字组成的数组:
(1)
data4 = np.linspace(1,10,100) print(data4,len(data4),data4.dtype)
此数组是等距离的。
(2)
data5 = np.arange(1,10,2) print(data5)
这里的2是步时,1,10是范围,因此,输出是这样的:
[1 3 5 7 9]
四,
均匀分布的随机数和正太随机数
- 均匀分布的随机数一般是在人工环境下生成,比如,人工种植的花卉的株间距,而在自然界中是基本没有均匀分布的随机数的哦。
例如在-1和1之间生成10000个均匀分布的随机数,这里的均匀是概率学里的均匀,而不是事实均匀。low是包含-1,high是不包含1。划分了1000组画的直方图。
import matplotlib.pyplot as plt import numpy as np data6 = np.random.uniform(low=-1,high=1,size=10000) plt.figure(figsize=(20,8),dpi=8) plt.hist(data6,1000) plt.show
结果如下:
0000 [ 0.63476024 0.30805251 -0.00222955 ... -0.97733247 0.56357678 0.33593682]
- 正太分布
什么是正态分布
正态分布是-种概率分布。正态分布是具有两个参数μ和σ的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ是此随机变量的方差,所以正态分布记作N(μ, σ)。
np.random.normal(loc,scale,size) 也就是说,正太随机数需要三个参数,μ参数和σ参数(这个也叫离散度,离散率)和随机数目
例如,以身高1.75为标准,离散度为0.1,随机总数为100000,并绘制直方图,代码如下:
import matplotlib.pyplot as plt import numpy as np data7 = np.random.normal(loc=1.75,scale=0.1,size=100000) plt.figure(figsize=(20,8),dpi=80) plt.hist(data7,10000) plt.show print(len(data7),data7)
结果如下:
100000 [1.65619401 1.7484766 1.81523809 ... 1.6623316 1.78668232 1.698971 ]
可以看到,直方图里的数据确实是以1.75为中轴,两边基本是分布一致。