开发者社区> 问答> 正文

数据抽取的主要功能有什么啊?

已解决

数据抽取的主要功能有什么啊?

展开
收起
游客ihzapojsw2ysk 2022-08-16 20:09:35 1299 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    第一个方面主要是数据抽取,主要确定要导入数据仓库中的数据,在很多情况下,数据源系统与数据仓库不在同一个数据服务器中,二者往往相互独立,并处于远程系统当中。数据抽取可以远程是的分布式的进行,这涉及到多种方式,主要有全面抽取和增量抽取两个方式。

    第二个方面是数据清洁。主要这个方面主要检查数据源中存在着矛盾的数据,按照用户确定的清洁规则进行清洗,数据主要包括数据预处理、标准化处理、查重以及出错处理和修正。

    第三个方面是数据格式转换。数据格式转换是把数据源中的数据转换成数据仓库所需要的格式,包括数据格式、数据内容、数据模式的转换。

    第四个方面是衍生数据生成,在数据仓库中保存了大量的历史数据,为了保证查询的效率,需要预处理用户常用的查询操作,以提高效率,生成衍生数据。这个些衍生数据既包括数据值数据的运算,也包括分类字段的形成。

    2022-08-16 21:30:38
    赞同 展开评论 打赏
问答分类:
来源圈子
更多
收录在圈子:
+ 订阅
技术图谱:由专家组参与技术图谱的绘制与编写,知识与实践的结合让开发者们掌握学习路线与逻辑,快速提升技能 电子书:电子书由阿里内外专家打造,供开发者们下载学习,更与课程相结合,使用户更易理解掌握课程内容 训练营:学习训练营 深入浅出,专家授课,带领开发者们快速上云 精品课程:汇集知识碎片,解决技术难题,体系化学习场景,深入浅出,易于理解 技能自测:提供免费测试,摸底自查 体验实验室:学完即练,云资源免费使用
问答排行榜
最热
最新

相关电子书

更多
数据展现:可视化报表及嵌入应用 立即下载
《Proxima:多模态向量检索引擎》 立即下载
Terark.com ——重新定义数据技术 立即下载