Pandas之三选择数据

简介: 介绍在pandas中筛选数据的几种方法,快速定位某行、某列、具体元素的方法

前文介绍了如何查看dataframe数据,现在再来看看怎么样定位和修改pandas的具体数据。

官方推荐选择数据的方法为.at, .iat, .loc, .iloc,这些方法可以指定行列的信息进行数据筛选。具体功能说明如下:

  • at:根据标签(label)定位具体元素
  • iat:根据位置定位具体元素
  • loc:根据标签截取Series、dataframe或具体元素
  • iloc:根据位置截取Series、dataframe或具体元素

配合起来可以在dataframe里面使用多种方式选择数据:

  1. 按数据列选择数据
  2. 使用列表[]方式选择数据
  3. 按标签选择数据
  4. 按位置选择数据
  5. 按条件筛选数据
  6. 以新值更新选择的数据

下面我们依然使用前文生成的df对象来演示各种方法

df = pd.DataFrame(np.random.randn(6, 4), 
                  index=dates, 
                  columns=list("ABCD"))

df

按列选择数据

可以使用df.A方式选择A列数据,该方式等同于df["A"]
在这里插入图片描述

也可以通过df[["A","B"]]方式选择多个列
在这里插入图片描述

列表[]方式选择数据

该方法是截取dataframe中的某些行

  1. 选择所有数据

在这里插入图片描述

  1. 通过索引位置选择某几行,该方法按照左闭右开方式截取数据
    在这里插入图片描述
  2. 选择某范围内的几行数据,该方法按照左闭右闭方式截取数据,类似于SQL语法中的between .. and ..

在这里插入图片描述

注:官方并不推荐使用以上这种方式做数据选择,推荐选择数据的方法为.at, .iat, .loc, .iloc

按标签选择数据

  1. 可以根据index值选择某行数据

在这里插入图片描述

  1. 可以根据用index的范围选择多行数据

在这里插入图片描述

  1. 在选择数据时,可以配合列名进一步选择数据

在这里插入图片描述

  1. 通过index和列名定位到某个cell具体的值(前文的方式获取到依然dataframe,而此处获取到的是标量数据),同时支持.loc.at方式。要注意的是:

    • .at不支持类型隐式转换,而.loc是支持的
    • .at的速度比.loc要快

在这里插入图片描述

按位置选择数据

通过位置选择数据的时候,既可以选择一行一列、一行多列、多行一列、多行多列也可以选择具体元素,在label不明确的时候,可以通过位置进行选择。最典型的场景就是选择首行、尾行等。

  1. 选择第n行数据,只输入一个参数时,默认为行。

在这里插入图片描述

  1. 选择第n行,某几列数据,同时输入行列数据时,使用逗号,间隔。在范围选择时,其按照左闭右开方式截取数据。

在这里插入图片描述

  1. 选择某几行,某列数据

在这里插入图片描述

  1. 选择某几行,某几列数据

在这里插入图片描述

  1. 选择所有行,某些列数据

在这里插入图片描述

  1. 选择具体元素

在这里插入图片描述

按条件选择数据

在pandas中也可以使用条件进行数据过滤,就像使用where条件一样。

  1. 根据某列值进行筛选,如图选择B>1的数据

在这里插入图片描述

  1. 对整个dataframe进行筛选,选择值>0的数据

在这里插入图片描述

  1. 使用isin()做数据筛选,类似sql中的in

在这里插入图片描述

更新数据

选择完数据之后,可以使用长度相同的数据的进行更新

  1. 将2021-09-01的A列数据更新为0

在这里插入图片描述

  1. 将D列使用numpy.array替代,此列是以len(df)[7]来替代

在这里插入图片描述


欢迎关注微信公众号:数据研发技术,会分享各类数据研发相关的技术

目录
相关文章
|
2月前
|
Serverless 数据处理 索引
Pandas中的shift函数:轻松实现数据的前后移动
Pandas中的shift函数:轻松实现数据的前后移动
184 0
|
18天前
|
Python
|
18天前
|
Python
|
17天前
|
Python
Pandas 常用函数-数据合并
Pandas 常用函数-数据合并
31 1
|
18天前
|
索引 Python
Pandas 常用函数-数据排序
10月更文挑战第28天
8 1
|
18天前
|
Python
Pandas 常用函数-查看数据
Pandas 常用函数-查看数据
14 2
|
18天前
|
SQL JSON 数据库
Pandas 常用函数-读取数据
Pandas 常用函数-读取数据
13 2
|
22天前
|
Python
通过Pandas库处理股票收盘价数据,识别最近一次死叉后未出现金叉的具体位置的方法
在金融分析领域,"死叉"指的是短期移动平均线(如MA5)下穿长期移动平均线(如MA10),而"金叉"则相反。本文介绍了一种利用Python编程语言,通过Pandas库处理股票收盘价数据,识别最近一次死叉后未出现金叉的具体位置的方法。该方法首先计算两种移动平均线,接着确定它们的交叉点,最后检查并输出最近一次死叉及其后是否形成了金叉。此技术广泛应用于股市趋势分析。
38 2
|
17天前
|
Python
Pandas 常用函数-数据选择和过滤
Pandas 常用函数-数据选择和过滤
10 0
|
1月前
|
数据可视化 数据挖掘 数据处理
模型预测笔记(四):pandas_profiling生成数据报告
本文介绍了pandas_profiling库,它是一个Python工具,用于自动生成包含多种统计指标和可视化的详细HTML数据报告,支持大型数据集并允许自定义配置。安装命令为`pip install pandas_profiling`,使用示例代码`pfr = pandas_profiling.ProfileReport(data_train); pfr.to_file("./example.html")`。
48 1
下一篇
无影云桌面