开发者社区 问答 正文

python中常见实现针对连续数据离散化的方法是什么?

python中常见实现针对连续数据离散化的方法是什么?

展开
收起
游客qzzytmszf3zhq 2021-11-30 15:17:33 646 分享 版权
1 条回答
写回答
取消 提交回答
  • 分位数法:使用四分位、五分位、十分位等分位数进行离散化处理,这种方法简单易行。 距离区间法:使用等距区间或自定义区间的方式进行离散化。这种方法比较领回,并且可以较好的保持数据原有结构分布。 频率区间法:将数据按照不同数据的频率分布进行排序,然后按照等频率或指定频率离散化,这种方法会把数据变换成均匀分布,但是会改变原有数据结果分布 聚类法: 卡方过滤:通过基于卡方的离散化方法,找出数据的最佳临近区间并合并,形成较大的区间

    2021-11-30 15:17:48
    赞同 展开评论