开发者社区> 问答> 正文

dataframe中如何对分类变量进行one-hot编码?

dataframe中如何对分类变量进行one-hot编码?

展开
收起
游客y244y7ln2rlpa 2021-12-05 20:28:40 537 0
1 条回答
写回答
取消 提交回答
  • df = pd.DataFrame(np.arange(25).reshape(5,-1), columns=list('abcde'))
    print(df)
    # 对列'a'进行onehot编码
    df_onehot = pd.concat([pd.get_dummies(df['a']), df[list('bcde')]], axis=1)
    print(df_onehot)
    
    #>	    a   b   c   d   e
    	0   0   1   2   3   4
    	1   5   6   7   8   9
    	2  10  11  12  13  14
    	3  15  16  17  18  19
    	4  20  21  22  23  24
    
    #>	   0  5  10  15  20   b   c   d   e
    	0  1  0   0   0   0   1   2   3   4
    	1  0  1   0   0   0   6   7   8   9
    	2  0  0   1   0   0  11  12  13  14
    	3  0  0   0   1   0  16  17  18  19
    	4  0  0   0   0   1  21  22  23  24
    
    
    2021-12-05 22:22:57
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载