我有一个看起来像的数据框
Fever Chill Cough Headache Respiratory Nasal Joint Pain Back pain Stomach pain
0 Y Y Y NaN NaN NaN NaN NaN NaN
1 Y NaN NaN NaN Y NaN NaN NaN NaN
2 Y NaN Y NaN NaN NaN NaN NaN NaN
3 Y NaN NaN NaN NaN NaN Y NaN NaN
4 Y NaN NaN NaN NaN NaN NaN NaN NaN
我想将列标题转换为单列(说出症状),使新列在包含值Y时包含列标题名称。所需的列应类似于:
Symptom
0 Fever, Chill, Cough
1 Fever, Respiratory
2 Fever, Cough
3 Fever, Joint Pain
4 Fever
我使用了堆栈的概念,但没有产生所需的输出。这是我的代码:
df[['Fever','Chill','Cough','Headache','Respiratory symptom','Nasal Symptoms','Joint Pain','Back pain','Stomach pain','Diarrhoea','Vomiting','Fatigue','Pneumonia shadow']].stack().reset_index()
谁能指导我如何获得理想的结果?
问题来源:stackoverflow
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
让我们这么做:
df.eq('Y').dot(df.columns+',').str[:-1]
#df['symptom'] = df.eq('Y').dot(df.columns+',').str[:-1]
回答来源:stackoverflow