pandas读取某列、某行数据——loc、iloc用法总结

简介: pandas读取某列、某行数据——loc、iloc用法总结

实际操作中我们经常需要寻找数据的某行或者某列,这里介绍我在使用Pandas时用到的两种方法:iloc和loc。

目录


1.loc方法


(1)读取第二行的值


(2)读取第二列的值


(3)同时读取某行某列


(4)读取DataFrame的某个区域


(5)根据条件读取


(6)也可以进行切片操作


2.iloc方法


(1)读取第二行的值


(2)读取第二行的值


(3)同时读取某行某列


(4)进行切片操作


loc:通过行、列的名称或标签来索引


iloc:通过行、列的索引位置来寻找数据


首先,我们先创建一个Dataframe,生成数据,用于下面的演示

import pandas as pd
import numpy as np
# 生成DataFrame
data = pd.DataFrame(np.arange(30).reshape((6,5)),
                    columns=['A','B','C','D','E'])


# 写入本地

data.to_excel("D:\\实验数据\\data.xls", sheet_name="data")
print(data)

image.png

1.loc方法

loc方法是通过行、列的名称或者标签来寻找我们需要的值。


(1)读取第二行的值

# 索引第二行的值,行标签是“1”

data1 = data.loc[1]

       结果:

image.png



备注:

#下面两种语法效果相同

data.loc[1] == data.loc[1,:]

(2)读取第二列的值

# 读取第二列全部值

data2 = data.loc[ : ,"B"]

       结果:

image.png



(3)同时读取某行某列

# 读取第1行,第B列对应的值

data3 = data.loc[ 1, "B"]

       结果:

image.png


(4)读取DataFrame的某个区域

# 读取第1行到第3行,第B列到第D列这个区域内的值

data4 = data.loc[ 1:3, "B":"D"]

       结果:

image.png



(5)根据条件读取

# 读取第B列中大于6的值

data5 = data.loc[ data.B > 6] #等价于 data5 = data[data.B > 6]

       结果:

image.png



(6)也可以进行切片操作

# 进行切片操作,选择B,C,D,E四列区域内,B列大于6的值

data1 = data.loc[ data.B >6, ["B","C","D","E"]]

结果:

image.png



2.iloc方法

iloc方法是通过索引行、列的索引位置[index, columns]来寻找值


(1)读取第二行的值

# 读取第二行的值,与loc方法一样

data1 = data.iloc[1]

# data1 = data.iloc[1, :],效果与上面相同

       结果:

image.png



(2)读取第二列的值

# 读取第二列的值

data1 = data.iloc[:, 1]

       结果:

image.png



(3)同时读取某行某列

# 读取第二行,第二列的值

data1 = data.iloc[1, 1]

       结果:

image.png



(4)进行切片操作

# 按index和columns进行切片操作

# 读取第2、3行,第3、4列

data1 = data.iloc[1:3, 2:4]

       结果:


image.png


注意:


这里的区间是左闭右开,data.iloc[1:3, 2:4]中的第4行、第5列取不到


相关文章
|
4天前
|
数据采集 数据可视化 数据挖掘
Pandas数据应用:天气数据分析
本文介绍如何使用 Pandas 进行天气数据分析。Pandas 是一个强大的 Python 数据处理库,适合处理表格型数据。文章涵盖加载天气数据、处理缺失值、转换数据类型、时间序列分析(如滚动平均和重采样)等内容,并解决常见报错如 SettingWithCopyWarning、KeyError 和 TypeError。通过这些方法,帮助用户更好地进行气候趋势预测和决策。
94 71
|
1天前
|
分布式计算 数据可视化 数据挖掘
Pandas数据应用:社交媒体分析
本文介绍如何使用Pandas进行社交媒体数据分析,涵盖数据获取、预处理、探索性分析和建模的完整流程。通过API获取数据并转换为DataFrame格式,处理缺失值和数据类型转换问题。利用Matplotlib等库进行可视化,展示不同类型帖子的数量分布。针对大规模数据集提供内存优化方案,并结合TextBlob进行情感分析。最后总结常见问题及解决方案,帮助读者掌握Pandas在社交媒体数据分析中的应用。
123 96
|
7天前
|
编解码 数据挖掘 开发者
Pandas数据导出:CSV文件
Pandas是Python中强大的数据分析库,提供了灵活的数据结构如DataFrame和Series。通过`to_csv()`函数可轻松将数据保存为CSV文件。本文介绍了基本用法、常见问题(如编码、索引、分隔符等)及解决方案,并涵盖大文件处理和报错解决方法,帮助用户高效导出数据。
123 83
|
3天前
|
存储 数据采集 数据可视化
Pandas数据应用:电子商务数据分析
本文介绍如何使用 Pandas 进行电子商务数据分析,涵盖数据加载、清洗、预处理、分析与可视化。通过 `read_csv` 等函数加载数据,利用 `info()` 和 `describe()` 探索数据结构和统计信息。针对常见问题如缺失值、重复记录、异常值等,提供解决方案,如 `dropna()`、`drop_duplicates()` 和正则表达式处理。结合 Matplotlib 等库实现数据可视化,探讨内存不足和性能瓶颈的应对方法,并总结常见报错及解决策略,帮助提升电商企业的数据分析能力。
98 73
|
9天前
|
数据挖掘 数据处理 索引
Pandas数据重命名:列名与索引为标题
Pandas 是强大的数据分析工具,支持灵活的数据结构和操作。本文介绍如何使用 Pandas 对 `DataFrame` 的列名和索引进行重命名,包括直接赋值法、`rename()` 方法及索引修改。通过代码示例展示了具体操作,并讨论了常见问题如名称冲突、数据类型不匹配及 `inplace` 参数的使用。掌握这些技巧可使数据更清晰易懂,便于后续分析。
54 29
|
5天前
|
数据采集 数据可视化 索引
Pandas数据应用:股票数据分析
本文介绍了如何使用Pandas库进行股票数据分析。首先,通过pip安装并导入Pandas库。接着,从本地CSV文件读取股票数据,并解决常见的解析错误。然后,利用head()、info()等函数查看数据基本信息,进行数据清洗,处理缺失值和重复数据。再者,结合Matplotlib和Seaborn进行数据可视化,绘制收盘价折线图。最后,进行时间序列分析,设置日期索引、重采样和计算移动平均线。通过这些步骤,帮助读者掌握Pandas在股票数据分析中的应用。
33 5
|
10天前
|
SQL 数据采集 数据挖掘
Pandas数据合并:concat与merge
Pandas是Python中强大的数据分析库,提供灵活高效的数据结构和工具。本文详细介绍了Pandas中的两种主要合并方法——`concat`和`merge`。`concat`用于沿特定轴连接多个Pandas对象,适用于简单拼接场景;`merge`则类似于SQL的JOIN操作,根据键合并DataFrame,支持多种复杂关联。文章还探讨了常见问题及解决方案,如索引对齐、列名冲突和数据类型不一致等,帮助读者全面掌握这两种方法,提高数据分析效率。
36 8
|
2月前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
81 0
|
4月前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
114 0
|
2月前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
53 2