​Data Science | 福利列表 | Numpy基础(三)

简介: ​Data Science | 福利列表 | Numpy基础(三)


numpy读取/写入数组数据

在我们使用numpy处理了数据之后,可以将数组保存为保存为Numpy专用的二进制格式,当我们这样操作之后,就不能用notepad++等打开看了(乱码)。

np.load和np.save是读写磁盘数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中。

存储数组数据(npy)
ar = np.random.rand(5,5)
print(ar)
np.save('arraydata.npy', ar)
读取数组数据(npy)
ar_load =np.load('arraydata.npy')
print(ar_load)

numpy读取/写入文本数据

除了保存为npy文件外,我们还可以将数据保存为txt格式的文本文件,np可以读写1维和2维的数组同时可以指定各种分隔符、针对特定列的转换器函数、需要跳过的行数等。

存储文本数据(txt)

这里需要注意的是关于文件保存的默认分隔符是空格,缺省按照'%.18e'格式保存数据。

ar = np.random.rand(5,5)
np.savetxt('array.txt',ar, delimiter=',')
# 改为以整数形式保存
np.savetxt("a.txt",a,fmt="%d",delimiter=",")
# np.savetxt(fname, X, fmt='%.18e', delimiter=' ', newline='\n', header='', footer='', comments='# '):存储为文本txt文件
读取文本数据(txt)

同样这里要注意的是读取也要标注分隔符的值,如果与保存时不同会报错。

ar_loadtxt = np.loadtxt('array.txt', delimiter=',')
print(ar_loadtxt)
>>>
[[ 0.28280684  0.66188985  0.00372083  0.54051044  0.68553963]
 [ 0.9138449   0.37056825  0.62813711  0.83032184  0.70196173]
 [ 0.63438739  0.86552157  0.68294764  0.2959724   0.62337767]
 [ 0.67411154  0.87678919  0.53732168  0.90366896  0.70480366]
 [ 0.00936579  0.32914898  0.30001813  0.66198967  0.04336824]]


相关文章
|
数据可视化 数据挖掘 vr&ar
Data Science | Numpy基础(二)
Data Science | Numpy基础(二)
109 0
|
vr&ar Python
Data Science | Numpy基础(一)
Data Science | Numpy基础(一)
Data Science | Numpy基础(一)
|
机器学习/深度学习 存储 Serverless
NumPy 与 Python 内置列表计算标准差的区别
NumPy,是 Numerical Python 的简称,用于高性能科学计算和数据分析的基础包,像数学科学工具(pandas)和框架(Scikit-learn)中都使用到了 NumPy 这个包。
|
1月前
|
机器学习/深度学习 数据可视化 搜索推荐
Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。
【7月更文挑战第5天】Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。流程包括数据获取、预处理、探索、模型选择、评估与优化,以及结果可视化。示例展示了用户行为、话题趋势和用户画像分析。Python的丰富生态使得社交媒体洞察变得高效。通过学习和实践,可以提升社交媒体分析能力。
50 1
|
2月前
|
BI 测试技术 索引
Python学习笔记之NumPy模块——超详细(安装、数组创建、正态分布、索引和切片、数组的复制、维度修改、拼接、分割...)-1
Python学习笔记之NumPy模块——超详细(安装、数组创建、正态分布、索引和切片、数组的复制、维度修改、拼接、分割...)
|
1月前
|
SQL 并行计算 API
Dask是一个用于并行计算的Python库,它提供了类似于Pandas和NumPy的API,但能够在大型数据集上进行并行计算。
Dask是一个用于并行计算的Python库,它提供了类似于Pandas和NumPy的API,但能够在大型数据集上进行并行计算。
|
12天前
|
数据采集 数据可视化 数据挖掘
使用Numpy进行高效的Python爬虫数据处理
使用Numpy进行高效的Python爬虫数据处理
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
【7月更文挑战第12天】Python的Pandas和NumPy库助力高效数据处理。Pandas用于数据清洗,如填充缺失值和转换类型;NumPy则擅长数组运算,如元素级加法和矩阵乘法。结合两者,可做复杂数据分析和特征工程,如产品平均销售额计算及销售额标准化。Pandas的时间序列功能,如移动平均计算,进一步增强分析能力。掌握这两者高级技巧,能提升数据分析质量和效率。
31 4