批量导入历史文件到日志服务

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介:

批量导数据的场景

日志服务主要接收实时写入日志,通过在机器上安装logtail,在控制台配置logtail配置,就能够实时收集到新产生的日志。但是对于一下场景

  • 新接入SLS的用户,希望把老的数据导入SLS。
  • 用户误操作造成的数据没有收集,需要补数据。
  • 日志不是实时产生,但需要批量导入,比如mysql binlog。

对于以上场景,用户需要使用日志服务的批量导数据工具才能够把数据写入日志服务。

导数据操作步骤

以下以导入/var/log/nginx/error_log.1到日志服务的nginx_log这个logstore为例,介绍导入历史数据的操作流程:

  1. 下载导数据工具 地址1 到你需要导数据的机器上.
  2. 在控制台为logstore(nginx_log)配置logtail配置,如果已经有了logtail配置,请忽略该步骤。logtail配置只需要正则式和时间格式能够匹配文件内容,不要求路径和文件名匹配。
  3. 把logtail配置应用到机器组上,机器组列表要包含导数据的机器ip、
  4. 在机器上执行
./import_log  --dir=/var/log/nginx/ --file=error_log.1 --begin_time=1443567661 --end_time=1448838061 \
--sls_region=cn-yunlei --project=ali-slsyunlei-scmg --logstore=nginx_error_log --topic=  \
--use_system_time=false  --quota_mb_per_min=500 --quota_qps=200   --dry_run=false

命令参数介绍

  • 文件相关参数

    • 目录名 --dir
    • 文件名 --file
    • 起始时间表示从哪个时间点开始导入数据 --begin_time
    • 结束时间表示导入数据截至到哪个时间点 --end_time
  • 日志服务参数,分别表示导入到哪个sls_region下的哪个project的logstore中,topic是什么

    • sls_region
    • project
    • logstore
    • topic
  • 系统参数

    • quota_qps 每分钟发送次数
    • quota_mb_per_min 每分钟数据量Mb
    • use_system_time=true 使用系统时间
    • dry_run=true 调试,把日志打印到终端
  • Region地址

    + cn-hangzhou  
    + cn-qingdao 
    + cn-beijing 
    + cn-shenzhen  
    
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
22天前
|
Linux Shell
Linux手动清理Linux脚本日志定时清理日志和log文件执行表达式
Linux手动清理Linux脚本日志定时清理日志和log文件执行表达式
77 1
|
1月前
|
Shell Linux C语言
【Shell 命令集合 网络通讯 】Linux 查看系统中的UUCP日志文件 uulog命令 使用指南
【Shell 命令集合 网络通讯 】Linux 查看系统中的UUCP日志文件 uulog命令 使用指南
29 0
|
1月前
|
Linux 应用服务中间件 nginx
【PUSDN】centos查看日志文件内容,包含某个关键字的前后5行日志内容,centos查看日志的几种方法
【PUSDN】centos查看日志文件内容,包含某个关键字的前后5行日志内容,centos查看日志的几种方法
47 0
|
1月前
|
监控 Shell Linux
【Shell 命令集合 系统管理 】Linux 自动轮转(log rotation)日志文件 logrotate命令 使用指南
【Shell 命令集合 系统管理 】Linux 自动轮转(log rotation)日志文件 logrotate命令 使用指南
49 0
|
4天前
|
运维 Oracle 关系型数据库
Oracle日志文件:数据王国的“记事本”
【4月更文挑战第19天】Oracle日志文件是数据库稳定运行的关键,记录数据变更历史,用于恢复和故障处理。它们协调并发操作,确保数据一致性和完整性。日志文件实时写入操作信息并定期刷新到磁盘,便于数据恢复。然而,日志文件需备份和归档以保证安全性,防止数据丢失。日志文件,数据王国的“记事本”,默默守护数据安全。
|
1月前
|
监控 Shell Linux
【Shell 命令集合 系统管理 】Linux 实时监控日志文件 swatch命令 使用指南
【Shell 命令集合 系统管理 】Linux 实时监控日志文件 swatch命令 使用指南
34 1
|
1月前
|
消息中间件 测试技术 Python
Python使用多线程解析超大日志文件
Python使用多线程解析超大日志文件
20 0
|
1月前
|
存储
Hudi Log日志文件格式分析(一)
Hudi Log日志文件格式分析(一)
25 1
|
1月前
|
缓存 索引
Hudi Log日志文件写入分析(二)
Hudi Log日志文件写入分析(二)
21 1
|
1月前
|
监控 Python
Python生成日志文件
Python生成日志文件
22 0

相关产品

  • 日志服务