如何计算分组dataframe的平均值,并将分组列保留为另一列?
df = pd.DataFrame({'fruit': ['apple', 'banana', 'orange'] * 2,
'rating': np.random.rand(6),
'price': np.random.randint(0, 15, 6)})
# 按fruit分组后,price列的平均值,并将分组置为一列
out = df.groupby('fruit', as_index=False)['price'].mean()
print(out)
#> fruit price
0 apple 4.0
1 banana 6.5
2 orange 11.0
33.如何获取两列值元素相等的位置(并非索引)
df = pd.DataFrame({'fruit1': np.random.choice(['apple', 'orange', 'banana'], 3),
'fruit2': np.random.choice(['apple', 'orange', 'banana'], 3)})
print(df)
# 获取两列元素相等的行
np.where(df.fruit1 == df.fruit2)
#> fruit1 fruit2
0 apple banana
1 apple apple
2 orange apple
#> (array([1], dtype=int64),)
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。