开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第五阶段):网站流量日志分析--数据导出--概述含义】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/697/detail/12245
网站流量日志分析--数据导出--概述含义
数据导出的概述含义
进行数据导出的开发,所谓的数据导出指的是当我们通过各种指标数量,分析的数据模型其实还是位于数据仓库当中的。
通过理解数仓我们可以知道,数仓本身是不会去消耗数据的,这就主要讲到我们主要的数据应用层来消费数据。
对于项目来说我们要构建一个所谓的数据可视化报表的项目,这就需要我们把数据从数仓中加载出来,从而我们进行页面上的展示,这时候需要一个工具所谓的技术来帮助我们把数据从数据仓库当中给其导出放在关系数据库当中以及进行页面上的展示。为了更好的理解这个过程,通过画图进行讲解。
首先大数据平台的三种架构,中间是我们的数据仓库层,用于开展数据分析的,简称为 DW 层。在其前面有一个临时存储层叫做原数据层,简称 ODS 层。
我们需要把数据从 ODS 到 DW 层,接下来我们分析路由指标来看谁可以使用,一般不消耗不生产数据,可以说是数据的搬运工。
上面是数据应用层,现在进行的是数据流程,简称 DA 层。其中数据很多,还有数据挖掘的,具有数据可视化就是用图形表格的方式。我们临时会创建一个缓存用 mysql 来存放,是需要一个过渡的。我们需要把数据仓库中的数据导出到数据库中,所学的数据导出就是这个流程,需要使用的是 sqoop 工具是很方便的,当数据导出后,显示到页面上,就完成了我们的整个流程,这就是数据导出。
sqoop 就是进行数据导入导出的一种工具,左边是面向事务的,后边是文件系统。需要来编写所用到的 sql 执行的命令,最后 sqoop 的导入导出是靠 m 码就行实现的。还有一个小技巧就是在程序的导入和导出时两个体系的流转过程。
Sqoop 会站在自家的立场上,所有进入自家都需要做导入,从自家出去就叫做导出。当数据导出时,我们可以通过页面进行可视化展示来加载数据进行漂亮的渲染,这就是数据导出的意义。