Python|Numpy读取本地数据和索引

简介: Python|Numpy读取本地数据和索引

1.什么是numpy

numpy是一个在python中做科学计算的基础库,重在数值计算,也是大部分python科学计算库的基础库,多用于在大型,多维数组上执行数值运算。学习numpy是后面学习pandas的重要基础。Numpynp.array()的方法就可以创建数组,常见的数据类型有intfloatbool。一般64位的电脑默认为int64,也可以通过dtype=‘ ’的方式来改变类型。数组的形状可以用(2,3)来表示,比如这个例子就表示这是一个23列的数组,用reshape()的方法可以更改数组的形状。数组的基本运算与矩阵的运算有点类似,但这不是今天的重点,今天主要讲的是numpy读取本地数据和索引。

 

2.Numpy读取数据

由于csv便于展示、读取和写入,所以很多地方也是用csv的格式存储和传输中小型的数据,操作csv格式的文件,操作数据库中的数据也是很容易的实现的。

np.loadtxt(frame,dtype=np.floatdelimiter=None,skiprows=0,usecols=None,unpack=False)

(1)frame:文件的路径。

(2)dtype:数据类型,可选,CSV的字符串以什么数据类型读入数组中,默认np. float

(3)delimiter:分隔字符串,默认是任何空格,改为逗号。

(4)skiprows:跳过前x行,一般跳过第一行表头。

(5)usecols:读取指定的列,索引,元组类型。

(6)unpack:如果True,读入属性将分别写入不同数组变量,False 读入数据只写入一个数    组变量,默认FalseUnpack实际上就是转置。

如下举例:

2.1

2.2

3.Numpy的索引和切片

Numpy的索引和切片和与列表相似,以后可能会经常遇到这样的操作,所以熟练掌握与切片相关的操作是很重要的。取某一行可以直接写t2[2],这个例子是指取第三行。要记住除了xpath是从下标1开始,其它的一般都是从0开始。取连续的多行t2[2:],从三行开始一直取。取不连续的多行t2[[0,2,4]],这就是数组与一般列表切片的区别。列与行相似,与列表相似t2[:,0]这个就表示对行不做任何操作,取第一列。取行和列,t2[2,3]。取多行和多列t2[0:2,1:3]。取多个不相邻的点t2[[0,1,2],[1,2,3]],它实际上取的点是(0,1),(1,2),(2,3)


4.Numpy中数值的修改              

数值的修改是比较简单的,想要修改一个值只需要找到这给数,再重新给它赋值就可以了。

如果想要修改,比如将所有小于10000的数变为1,就可以写t2[t2<10]=1。也可以用np.where(t2<10000,1,0),三元运算符将小于10000的变为1,否则变为0.

目录
相关文章
|
10天前
|
存储 JSON JavaScript
【chat-gpt问答记录】python将数据存为json格式和yaml格式
【chat-gpt问答记录】python将数据存为json格式和yaml格式
26 1
|
8天前
|
数据采集 Web App开发 数据挖掘
使用Python和BeautifulSoup轻松抓取表格数据
使用Python和BeautifulSoup,结合代理IP,可以从网页抓取表格数据,如中国气象局的天气信息。通过requests库发送HTTP请求,BeautifulSoup解析HTML提取表格。安装必要库后,设置代理IP,发送请求,解析HTML找到表格,提取数据并存储。通过Pandas进行数据分析,如计算平均气温。这种方法让数据抓取和分析变得更加便捷。
使用Python和BeautifulSoup轻松抓取表格数据
|
9天前
|
数据采集 Web App开发 数据处理
一步步教你用Python Selenium抓取动态网页任意行数据
使用Python Selenium爬取动态网页,结合代理IP提升抓取效率。安装Selenium,配置代理(如亿牛云),设置User-Agent和Cookies以模拟用户行为。示例代码展示如何使用XPath提取表格数据,处理异常,并通过隐式等待确保页面加载完成。代理、模拟浏览器行为和正确配置增强爬虫性能和成功率。
一步步教你用Python Selenium抓取动态网页任意行数据
|
4天前
|
存储 数据挖掘 Python
使用Python集合高效统计Excel数据
使用Python集合高效统计Excel数据
17 7
|
3天前
|
机器学习/深度学习 算法 Python
Python 使用SMOTE解决数据不平衡问题(最新推荐)
SMOTE是一种强大的过采样技术,可以有效地处理不平衡数据集,提升分类器的性能。通过imbalanced-learn库中的SMOTE实现,我们可以轻松地对少数类样本进行过采样,平衡数据集。在实际应用中,我们可以根据具体数据集的特点和需求,选择合适的过采样方法。
|
4天前
|
数据可视化 Python
Python中的数据可视化:在数据点上添加标签
Python中的数据可视化:在数据点上添加标签
21 3
|
9天前
|
Python
Python列表推导式是一种简洁的创建新列表的方式,它允许你在一行代码中完成对数据的操作和转换
【6月更文挑战第19天】Python列表推导式是创建新列表的简洁语法,它在一行内处理数据。表达式如`[expr for item in iterable if cond]`,其中`expr`是对元素的操作,`item`来自`iterable`,`if cond`是可选过滤条件。例如,将数字列表平方:`[x**2 for x in numbers]`。嵌套列表推导处理复杂结构,如合并二维数组:`[[a+b for a,b in zip(row1, row2)] for row1, row2 in zip(matrix1, matrix2)]`。简洁但勿过度复杂化。
20 5
|
9天前
|
存储 数据安全/隐私保护 计算机视觉
Python教程:一文了解从Bytes到Bits的数据转换
在Python编程中,处理数据时经常需要在字节(bytes)和位(bits)之间进行转换。这种转换在网络通信、数据加密、图像处理等领域尤为常见。本文将详细介绍如何在Python中进行字节与位之间的转换,并提供一个实用的功能:如何在指定的位位置替换位数据。
19 4
|
9天前
|
Python
Python+Jinja2实现接口数据批量生成工具
在做接口测试的时候,我们经常会遇到一种情况就是要对接口的参数进行各种可能的校验,手动修改很麻烦,尤其是那些接口参数有几十个甚至更多的,有没有一种方法可以批量的对指定参数做生成处理呢。
18 3
|
3天前
|
XML 数据格式 Python
Python使用xpath对解析内容进行数据提取
今天就介绍一个用于提取所需数据的方法之一xpath。在后续会讲解bs4(beautifulsoup),re正则表达式。