Pandas库是Python中用于数据处理和分析的主要库之一。它提供了DataFrame数据结构,可以方便地对数据进行筛选和过滤。
以下是使用Pandas进行数据筛选和过滤的基本步骤:
- 导入pandas库。
- 创建或加载DataFrame。
- 使用布尔索引、
query()
方法或loc[]
、iloc[]
方法进行数据筛选。
以下是具体的代码示例:
# 导入pandas库
import pandas as pd
# 创建DataFrame
data = {
'Name': ['Tom', 'Nick', 'John', 'Tom'], 'Age': [20, 21, 19, 18]}
df = pd.DataFrame(data)
# 使用布尔索引进行数据筛选
filtered_df = df[df['Age'] > 19]
print(filtered_df)
# 使用query()方法进行数据筛选
filtered_df = df.query('Age > 19')
print(filtered_df)
# 使用loc[]方法进行数据筛选
filtered_df = df.loc[df['Age'] > 19]
print(filtered_df)
在这个例子中,我们首先创建了一个包含两列('Name'和'Age')的DataFrame。然后,我们使用三种不同的方法对年龄大于19的数据进行了筛选。