Pandas 判断两列内容是否相同并将结果新建一列
1、首先写一个函数,实现判断是否相等的功能,如下:
1. def function(a, b): 2. if a == b: 3. return 1 4. else: 5. return 0
2、用 pandas 里面强大的 lambda 处理文件(如CSV文件):
import pandas as pd; data = pd.read_csv('test.csv') df = pd.DataFrame(data) df['bool'] = df.apply(lambda x : function(x['A'],x['B']),axis = 1)
其中 A, B是需要比较是否相等的两列的列名。
以上,新生成的 bool 列内容即是 0 和 1 用来表示 A 列和 B列是否相等。