网站流量日志分析--数据导出--概述含义 | 学习笔记

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习网站流量日志分析--数据导出--概述含义

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第五阶段):网站流量日志分析--数据导出--概述含义】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/697/detail/12245


网站流量日志分析--数据导出--概述含义

数据导出的概述含义

进行数据导出的开发,所谓的数据导出指的是当我们通过各种指标数量,分析的数据模型其实还是位于数据仓库当中的。

通过理解数仓我们可以知道,数仓本身是不会去消耗数据的,这就主要讲到我们主要的数据应用层来消费数据。

对于项目来说我们要构建一个所谓的数据可视化报表的项目,这就需要我们把数据从数仓中加载出来,从而我们进行页面上的展示,这时候需要一个工具所谓的技术来帮助我们把数据从数据仓库当中给其导出放在关系数据库当中以及进行页面上的展示。为了更好的理解这个过程,通过画图进行讲解。

图片1.png

首先大数据平台的三种架构,中间是我们的数据仓库层,用于开展数据分析的,简称为 DW 层。在其前面有一个临时存储层叫做原数据层,简称 ODS 层。

我们需要把数据从 ODS 到 DW 层,接下来我们分析路由指标来看谁可以使用,一般不消耗不生产数据,可以说是数据的搬运工。

上面是数据应用层,现在进行的是数据流程,简称 DA 层。其中数据很多,还有数据挖掘的,具有数据可视化就是用图形表格的方式。我们临时会创建一个缓存用 mysql 来存放,是需要一个过渡的。我们需要把数据仓库中的数据导出到数据库中,所学的数据导出就是这个流程,需要使用的是 sqoop 工具是很方便的,当数据导出后,显示到页面上,就完成了我们的整个流程,这就是数据导出。

sqoop 就是进行数据导入导出的一种工具,左边是面向事务的,后边是文件系统。需要来编写所用到的 sql 执行的命令,最后 sqoop 的导入导出是靠 m 码就行实现的。还有一个小技巧就是在程序的导入和导出时两个体系的流转过程。

Sqoop 会站在自家的立场上,所有进入自家都需要做导入,从自家出去就叫做导出。当数据导出时,我们可以通过页面进行可视化展示来加载数据进行漂亮的渲染,这就是数据导出的意义。

图片2.png

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
28天前
|
PyTorch 算法框架/工具
Pytorch学习笔记(七):F.softmax()和F.log_softmax函数详解
本文介绍了PyTorch中的F.softmax()和F.log_softmax()函数的语法、参数和使用示例,解释了它们在进行归一化处理时的作用和区别。
288 1
Pytorch学习笔记(七):F.softmax()和F.log_softmax函数详解
|
1月前
|
存储 消息中间件 大数据
大数据-68 Kafka 高级特性 物理存储 日志存储概述
大数据-68 Kafka 高级特性 物理存储 日志存储概述
24 1
|
27天前
|
数据可视化
Tensorboard可视化学习笔记(一):如何可视化通过网页查看log日志
关于如何使用TensorBoard进行数据可视化的教程,包括TensorBoard的安装、配置环境变量、将数据写入TensorBoard、启动TensorBoard以及如何通过网页查看日志文件。
150 0
|
30天前
|
监控 网络协议 CDN
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
|
3月前
|
jenkins 持续交付
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
|
5月前
|
存储 Java 关系型数据库
基于JSP的九宫格日志网站
基于JSP的九宫格日志网站
|
5月前
|
JSON 中间件 数据格式
Gin框架学习笔记(六)——gin中的日志使用
Gin框架学习笔记(六)——gin中的日志使用
160 0
|
6月前
|
安全 Linux 调度
【后台开发】TinyWebser学习笔记(4)定时器、日志系统(单例模式)、封装互斥锁信号量
【后台开发】TinyWebser学习笔记(4)定时器、日志系统(单例模式)、封装互斥锁信号量
37 1
|
4天前
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
79 30
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
30天前
|
XML JSON Java
Logback 与 log4j2 性能对比:谁才是日志框架的性能王者?
【10月更文挑战第5天】在Java开发中,日志框架是不可或缺的工具,它们帮助我们记录系统运行时的信息、警告和错误,对于开发人员来说至关重要。在众多日志框架中,Logback和log4j2以其卓越的性能和丰富的功能脱颖而出,成为开发者们的首选。本文将深入探讨Logback与log4j2在性能方面的对比,通过详细的分析和实例,帮助大家理解两者之间的性能差异,以便在实际项目中做出更明智的选择。
183 3