2018上海云栖大会workshop-日志数据采集与分析对接

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 日志数据采集与分析对接 课程描述 通过日志服务采集用户、数据库、业务等访问数据。演示对于业务日志分析与处理,程序日志查询与监控,打通日志与数据仓库对接案例。 日志种类 网站访问日志准备步骤 & 依赖 ECS虚拟机(测试账号默认包含,并且访问日志产生) OSSBucket 用做数据仓库,存储日志服.

日志数据采集与分析对接

课程描述

通过日志服务采集用户、数据库、业务等访问数据。演示对于业务日志分析与处理,程序日志查询与监控,打通日志与数据仓库对接案例。

日志种类

  • 网站访问日志

准备步骤 & 依赖

  • ECS虚拟机(测试账号已默认创建虚拟机-ECS控制台
  • OSSBucket

    • 用做数据仓库,存储日志服务同步的各类数据
  • RAM服务

    • 生成RAM角色用于同步日志数据至OSSBucket

操作步骤

  • 日志采集配置

    • 登陆日志服务控制台,选择华东1创建日志服务project,其中Project名称全局唯一,建议名称加上登陆账号前缀进行区别
      创建Project.png

_Logstore_

  • 创建logstore存储访问日志
    Logstore名称.png
  • 向导创建NGINX日志采集
    接入数据向导.png

向导-1.png

  • 配置文件路径(/var/log)和文件名称(access_log),其中NGINX日志配置为:

    log_format web_site_com '"$remote_addr" "$remote_user" "[$time_local]" "$request" ' 
        '"$status" "$body_bytes_sent" "$http_referer" "$http_user_agent" "$host" '
        '"$http_x_forwarded_for" "$request_time" "$request_length" "$remote_port" ' 
        '"$upstream_response_time"';

    向导-2.png

  • 创建机器组(打开ECS控制台获取机器IP地址)
    ECS机器.png

向导-3.png

  • 开启日志分析
    向导-5.png
  • 开启数仓同步
    OSSWizard.png

    • 打开OSS控制台,可以看到一个以workshop名称开头的bucket,复制名称至“OSS Bucket”输入框
      OSSBucket.png
    • 授权日志服务同步数据至OSS(点击授权链接
      grant.png
    • 获取RAM角色名称(点击链接
      角色名称.png
    • 指定OSSBucket同步指定日志数据(其中可填入字段名称包括:request_method,request_time,remote_addr,request_length,http_user_agent等在查询页面看到的所有字段)
      OSS.png
  • 日志查询分析

    • 根据关键词查询访问日志
      日志查询.png
    • 分析统计NGINX访问日志(预置仪表盘使用:包含地图/各类基本图形等)
      日志仪表盘.png
  • 数仓同步

    • 等待1-2min后,可以在OSS中看到生成的数据目录
      OSS数据.png

实验耗费

  • ECS虚拟机
  • 日志服务
  • OSS存储
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
19天前
|
存储 SQL 监控
|
19天前
|
运维 监控 安全
|
22天前
|
监控 关系型数据库 MySQL
分析慢查询日志
【10月更文挑战第29天】分析慢查询日志
37 3
|
22天前
|
监控 关系型数据库 数据库
怎样分析慢查询日志?
【10月更文挑战第29天】怎样分析慢查询日志?
34 2
|
1月前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1646 14
|
1月前
|
存储 消息中间件 大数据
大数据-69 Kafka 高级特性 物理存储 实机查看分析 日志存储一篇详解
大数据-69 Kafka 高级特性 物理存储 实机查看分析 日志存储一篇详解
39 4
|
2月前
|
人工智能 Linux 云栖大会
看过来!2024 云栖大会操作系统技术 Workshop 怎么玩?
报名倒计时2天啦,欢迎大家来“操作系统技术Workshop”打卡。专家讲解原理、现场实战演练,AI、C++ 20专场任选。
看过来!2024 云栖大会操作系统技术 Workshop 怎么玩?
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
47 2
|
1月前
|
存储 数据采集 分布式计算
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
44 1
|
2月前
|
Kubernetes API Docker
跟着iLogtail学习容器运行时与K8s下日志采集方案
iLogtail 作为开源可观测数据采集器,对 Kubernetes 环境下日志采集有着非常好的支持,本文跟随 iLogtail 的脚步,了解容器运行时与 K8s 下日志数据采集原理。

相关产品

  • 日志服务
  • 下一篇
    无影云桌面