选择和过滤数据DataFrame的案例解析如下:
首先,我们需要导入pandas库,并创建一个字典,其中键是列名,值是列中的数据。然后,我们可以使用pandas的DataFrame()函数将字典转换为DataFrame。
import pandas as pd
data = {
'姓名': ['张三', '李四', '王五', '赵六'],
'年龄': [25, 30, 35, 40],
'城市': ['北京', '上海', '深圳', '广州']
}
df = pd.DataFrame(data)
print(df)
输出结果:
姓名 年龄 城市
0 张三 25 北京
1 李四 30 上海
2 王五 35 深圳
3 赵六 40 广州
接下来,我们可以使用DataFrame的loc[]方法来选择满足特定条件的数据。例如,我们可以选择年龄大于30的人。
selected_data = df.loc[df['年龄'] > 30]
print(selected_data)
输出结果:
姓名 年龄 城市
2 王五 35 深圳
3 赵六 40 广州
我们还可以使用DataFrame的iloc[]方法来选择满足特定位置条件的数据。例如,我们可以选择第1行和第3行的数据。
selected_data = df.iloc[[0, 2]]
print(selected_data)
输出结果:
姓名 年龄 城市
0 张三 25 北京
2 王五 35 深圳
此外,我们还可以使用DataFrame的query()方法来根据字符串表达式选择数据。例如,我们可以选择年龄大于30且城市为北京的人。
selected_data = df.query('年龄 > 30 and 城市 == "北京"')
print(selected_data)
输出结果:
姓名 年龄 城市
0 张三 25 北京