什么是数据分析步骤中的处理数据?

已解决

什么是数据分析步骤中的处理数据?

展开
收起
云上静思 2022-10-18 15:21:41 734 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 推荐回答

    处理数据的意思就是提取特征数据。在真实的工作场景中,除了数据格式不统一,数据的内容往往也参差不齐,很少能直接拿到 一份干净又完整的数据。比如有些样本数据会缺失部分特征、有些数据是明显的异常数据。

    所以在开始分析之前,还需要 对数据做进一步的处理,比如用默认值填充缺失的值、过滤掉明显重复的或者异常的数据,这个步骤一般也叫“特征工 程”,需要耗费比较长的时间才能把数据整理好。

    以上内容摘自《PolarDB for PostgreSQL 源码与应用实战》电子书,点击https://developer.aliyun.com/ebook/download/7773可下载完整版

    2022-10-18 16:26:11 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论

PolarDB 分布式版 (PolarDB for Xscale,简称“PolarDB-X”) 采用 Shared-nothing 与存储计算分离架构,支持水平扩展、分布式事务、混合负载等能力,100%兼容MySQL。 2021年开源,开源历程及更多信息访问:OpenPolarDB.com/about

还有其他疑问?
咨询AI助理
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等