开发者社区> 问答> 正文

数据预处理中的数据清理功能具体是怎么样处理数据的啊?

已解决

数据预处理中的数据清理功能具体是怎么样处理数据的啊?

展开
收起
游客dof4ggxyen75u 2022-07-26 08:57:25 466 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    数据清洗要去除源数据集中的噪声数据和无关数据,处理遗漏数据和清洗脏数据、空缺值,识别删除孤立点等。

    对于噪声的清理,采用去噪的方法,可以通过分箱(将数据分成不同的区间,然后降低噪声的影响),也可以通过回归或者聚类的方法来解决噪声的问题。

    对缺失值的处理,可以通过很多方法,例如清理缺失值,或者将其忽略,也可以使用一个可能的值填充,如果更加科学的话可以使用一些模型来预测最具可能性的值(例如回归模型、决策树等等)。

    清洗脏数据可以通过数据清洗工具、数据审计工具、数据迁移工具来实现。

    2022-07-26 09:36:09
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
百度大规模时序指标自动异常检测实战 立即下载
4个迭代,从批量交...1573957773.pdf 立即下载
《基于数据全生命周期的数据资产价值评估方法及应用》论文 立即下载

相关实验场景

更多