about云日志分析实战之清洗日志小实例2:导入日志清洗代码并打包

简介: about云日志分析实战之清洗日志小实例2:导入日志清洗代码并打包

前面测试了一下spark,准备好环境,下面开始动工源码。分析清洗日志,这里面的代码还是比较复杂的。对于iis日志,可参考

about云日志分析项目准备10-3:Spark Local模式之Log文本清洗

http://www.aboutyun.com/forum.php?mod=viewthread&tid=21135

对于Apache日志,国外已经实现。源码git地址

https://github.com/alvinj/ScalaApacheAccessLogParser


网盘下载地址

链接:http://pan.baidu.com/s/1jIj87wM 密码:p0zd


这里从上面下载下来,然后导入IntelliJ IDEA ,然后打包。


导入源码


首先file-》open


f8800c461084022789af28780c25ed7d.jpg

选择源码文件

3b78524f91e981a926a2f598961ea4b0.jpg

导入之后看到下面内容

50b9be398773b86430d1c0232dba3196.jpg

对于spark环境不熟悉或则不会操作可参考

spark开发环境详细教程1:IntelliJ IDEA使用详细说明

http://www.aboutyun.com/forum.php?mod=viewthread&tid=22320


spark开发环境详细教程3:IntelliJ IDEA创建项目

http://www.aboutyun.com/forum.php?mod=viewthread&tid=22410


打包


上面我们准备了源码,然后将源码打成jar包,供我们项目中使用。

首先打开project structure,

2d2fd255683cd8ec6e8a8ca541bb4855.jpg

选择依赖

b8778e1c0239a1cd69f3a780dad6cc08.jpg

填写主类

1411355ccf9d06002558ee633faed27f.jpg

点击确定

8997ddb33ada95fa6efcb603ac0da916.jpg

选择菜单 Build Artifacts

b28a5b0f1bf7d141988ef227618b3f9c.jpg点击build

c39b046b4d4356de2dc999613c9e1e30.jpg

最后生成jar包,在terminal中会显示输出jar包路径

ed203225a217eb9cfb973117e2ab5445.jpg

找到生成jar包。我们就可以使用了。

d62cbbf0fac347715f00320ccea07a1b.jpg

相关实践学习
通过日志服务实现云资源OSS的安全审计
本实验介绍如何通过日志服务实现云资源OSS的安全审计。
目录
相关文章
|
11月前
|
监控 测试技术 Go
告别传统Log追踪!GOAT如何用HTTP接口重塑代码监控
本文介绍了GOAT(Golang Application Tracing)工具的使用方法,通过一个Echo问答服务实例,详细展示了代码埋点与追踪技术的应用。内容涵盖初始化配置、自动埋点、手动调整埋点、数据监控及清理埋点等核心功能。GOAT适用于灰度发布、功能验证、性能分析、Bug排查和代码重构等场景,助力Go项目质量保障与平稳发布。工具以轻量高效的特点,为开发团队提供数据支持,优化决策流程。
687 89
|
8月前
|
运维 安全 数据可视化
日志审查安排工具实战攻略:中小团队如何通过日志审查安排工具建立可控、安全的审查机制?
在审计敏感时代,日志审查安排工具成为安全运维与合规管理的关键利器。它实现审查任务的流程化、周期化与可视化,支持多系统协作、责任到人,确保“可控、可查、可追”的日志治理。工具如板栗看板、Asana、Monday 等提供任务调度、问题闭环与合规对接能力,助力企业构建高效、透明的日志审查体系,提升安全与合规水平。
|
存储 运维 监控
超越传统模型:从零开始构建高效的日志分析平台——基于Elasticsearch的实战指南
【10月更文挑战第8天】随着互联网应用和微服务架构的普及,系统产生的日志数据量日益增长。有效地收集、存储、检索和分析这些日志对于监控系统健康状态、快速定位问题以及优化性能至关重要。Elasticsearch 作为一种分布式的搜索和分析引擎,以其强大的全文检索能力和实时数据分析能力成为日志处理的理想选择。
1023 6
|
运维 监控 Cloud Native
一行代码都不改,Golang 应用链路指标日志全知道
本文将通过阿里云开源的 Golang Agent,帮助用户实现“一行代码都不改”就能获取到应用产生的各种观测数据,同时提升运维团队和研发团队的幸福感。
735 132
|
9月前
|
人工智能 运维 监控
Aipy实战:分析apache2日志中的网站攻击痕迹
Apache2日志系统灵活且信息全面,但安全分析、实时分析和合规性审计存在较高技术门槛。为降低难度,可借助AI工具如aipy高效分析日志,快速发现攻击痕迹并提供反制措施。通过结合AI与学习技术知识,新手运维人员能更轻松掌握复杂日志分析任务,提升工作效率与技能水平。
|
监控 测试技术 开发者
一行代码改进:Logtail的多行日志采集性能提升7倍的奥秘
一个有趣的现象引起了作者的注意:当启用行首正则表达式处理多行日志时,采集性能出现下降。究竟是什么因素导致了这种现象?本文将探索Logtail多行日志采集性能提升的秘密。
592 57
|
Java 程序员 应用服务中间件
「测试线排查的一些经验-中篇」&& 调试日志实战
「测试线排查的一些经验-中篇」&& 调试日志实战
265 1
「测试线排查的一些经验-中篇」&& 调试日志实战
|
Java Maven Spring
超实用的SpringAOP实战之日志记录
【11月更文挑战第11天】本文介绍了如何使用 Spring AOP 实现日志记录功能。首先概述了日志记录的重要性及 Spring AOP 的优势,然后详细讲解了搭建 Spring AOP 环境、定义日志切面、优化日志内容和格式的方法,最后通过测试验证日志记录功能的准确性和完整性。通过这些步骤,可以有效提升系统的可维护性和可追踪性。
508 1
|
数据采集 机器学习/深度学习 存储
使用 Python 清洗日志数据
使用 Python 清洗日志数据
390 2