在pandas中,可以使用merge
函数将两个dataframe合并在一起,然后使用query
函数根据指定的条件选取数据。以下是一个例子:
import pandas as pd
# 创建第一个dataframe
df1 = pd.DataFrame({
'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3']
})
# 创建第二个dataframe
df2 = pd.DataFrame({
'A': ['A1', 'A2', 'A3', 'A4'],
'D': ['D1', 'D2', 'D3', 'D4']
})
# 合并两个dataframe
df = pd.merge(df1, df2, on='A')
# 根据'D'列的值选取数据
df = df.query('D == "D2"')
print(df)
在这个例子中,我们首先创建了两个dataframe,然后使用merge
函数将它们合并在一起,on
参数指定了合并的关键列。然后,我们使用query
函数根据D
列的值选取数据,D == "D2"
表示选取D
列的值为D2
的行。
输出结果如下:
A B C D
1 A1 B1 C1 D2
可以看到,我们成功地选取了在df2
中D
列的值为D2
的行,并将它们与df1
合并在一起。