开发者社区问答正文

如何在两个相同的csv文件之间仅获取 Pandas 中的匹配列值

我有两个CSV文件都有超过50000行，现在我只想查找两个CSV文件之间的匹配记录。我已经尝试了很多类似的Pandas函数，并且所有记录返回的响应都只有“ true”和“ false”。

如何只获取两个CSV之间的匹配列值？

 df2 = id externalcode
       1   00
       2   00




 df2 = id externalcode
        1   00
        2   00

任何帮助，将不胜感激。我尝试过的代码如下：

data_frame1 = pd.read_csv("one.csv")
data_frame2 = pd.read_csv("two.csv")
print(type(data_frame1),type(data_frame2))
result = data_frame1[data_frame1['id'] == data_frame2['id']]
df1 = data_frame1['id'].isin(data_frame2['id'])
df2 = data_frame1['values_externalCode'].isin(data_frame2['values_externalCode'])

问题来源：stackoverflow

展开

收起

is大龙 2020-03-23 23:56:56 627 版权

1 条回答

写回答

取消提交回答

is大龙
```
df1 = data_frame1[data_frame1['id'].isin(list(data_frame2['id']))]
```
我修改了您的尝试之一，如果有效，请告诉我！因此，此代码将选择data_frame1中的ID，这些ID也将出现在data_frame2中。

回答来源：stackoverflow
2020-03-23 23:57:01

赞同展开评论

问答标签：

Pandas文件 csv文件Pandas Pandas csv Pandas列值

问答地址：

开发者社区 > 云计算 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

如何在两个相同的csv文件之间仅获取 Pandas 中的匹配列值