开发者社区 问答 正文

Python常见的数据预处理包括什么?

Python常见的数据预处理包括什么?

展开
收起
芯在这 2021-12-08 10:33:06 379 分享 版权
1 条回答
写回答
取消 提交回答
  • 1、缺失值处理

    缺失值是指在一组数据中,某行数据缺失的某个特征值。解决缺失值有两种方法,一是将该缺失值所在的这行数据删除掉,二是将这个缺失值补充一个正确的值。

    2、异常值处理

    异常值产生的原因往往是数据在采集时发生了错误,如在采集数字68时发生了错误,误将其采集成680。在处理异常值之前,自然需要先发现这些异常值数据,往往可以借助画图的方法来发现这些异常值数据。在对异常值数据处理完成之后,原始数据才会趋于正确,才能保证最终结果的准确性。

    3、数据集成

    相较于上文的缺失值处理和异常值处理,数据集成是一种较为简单的数据预处理方式。那么数据集成是什么?假设存在两组结构一样的数据A和数据B,且两组数据都已加载进入内存,这时候如果用户想将这两组数据合并为一组数据,可以直接使用Pandas对其进行合并,而这个合并的过程实际上就是数据的集成。

    2021-12-08 10:33:28
    赞同 展开评论
问答分类:
问答地址: