阿里云EMR自定义日志投递与使用实践分享

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: EMR目前支持了日志管理,即日志客户SLS投递的功能,基于此功能,客户可以将需要的各种大数据组件日志收集到自身SLS中,做查询和分析。基于此功能,客户可以自定义日志路径、规则,对集群设备上的日志自行接收和消费。本文以采集指标文件为例,帮助您快速上手自定义日志投递与使用。

作者:锦琛@阿里云

引言

开源大数据平台 E-MapReduce(简称“EMR”)是云原生开源大数据平台,向客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎。


EMR目前支持了日志管理,即日志客户SLS投递的功能,基于此功能,客户可以将需要的各种大数据组件日志收集到自身SLS中,做查询和分析。基于此功能,客户可以自定义日志路径、规则,对集群设备上的日志自行接收和消费。本文以采集指标文件为例,帮助您快速上手自定义日志投递与使用。


关键字

E-MapReduce,日志管理,日志投递,日志消费


前提条件

已有阿里云EMR集群,且已开启日志查询功能。更多信息,请参见管理日志


步骤1:配置采集

  1. 登陆E-MapReduce服务控制台
  2. 选择前往日志服务控制台,点击右上角前往日志服务控制台。

image.png

  1. 创建日志库,选择合适的数据保存时间。

image.png

  1. 在新建日志库下点开logtail配置,选择json文件日志。

image.png

  1. 若开启日志投递,会看到已有的机器组,应用该机器组。

image.png

  1. 配置Logtail

设置日志路径/mnt/disk1/log/taihao_exporter/**/metrics.log*

然后点击下一步至完成。

image.png

  1. 索引配置(可选)

也可以配置索引方便对其做搜索,如图所示自动生成索引。

image.png


步骤2:查询指标

配置完毕后,就可以在sls上看到指标了。

image.png

您可以在Logstore的查询和分析页面,输入查询语句,选择时间范围,单击查找/分析,进行日志查询操作。

  • 查询指标名为yarn_nodemanager_jvm_GcTimeMillis的值。
*and name: yarn_nodemanager_jvm_GcTimeMillis
  • 查询指标名yarn_nodemanager_jvm_GcTimeMillis且value>200的值。
*and name: yarn_nodemanager_jvm_GcTimeMillis and value >200
  • 查询header节点的yarn_timelineserver_jvm_GcTimeMillis指标。
*and hostname:"emr-header-1.cluster-500202362"and name: yarn_timelineserver_jvm_GcTimeMillis 


步骤3:分析日志

您可以在Logstore的查询和分析页面,输入查询和分析语句,选择时间范围,单击查找/分析,进行日志分析操作。

  • 统计不同指标的数量。
*|SELECT"name",COUNT(*)AS PV GROUPBY"name"

image.png

  • 计算不同时刻对应的指标数量,并按照时刻进行升序排序。
*|SELECT"timestamp",COUNT(*)AScountGROUPBY"timestamp"ORDERBY"timestamp"

image.png


参考信息:日志样例

image.png





钉钉扫码进群,了解更多详情

image.png

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
1月前
|
SQL 存储 缓存
阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse
本文介绍了阿里云EMR StarRocks在数据湖分析领域的应用,涵盖StarRocks的数据湖能力、如何构建基于Paimon的实时湖仓、StarRocks与Paimon的最新进展及未来规划。文章强调了StarRocks在极速统一、简单易用方面的优势,以及在数据湖分析加速、湖仓分层建模、冷热融合及全链路ETL等场景的应用。
284 2
阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse
|
1月前
|
SQL 存储 缓存
降本60% ,阿里云 EMR StarRocks 全新发布存算分离版本
阿里云 EMR Serverless StarRocks 现已推出全新存算分离版本,该版本不仅基于开源 StarRocks 进行了全面优化,实现了存储与计算解耦架构,还在性能、弹性伸缩以及多计算组隔离能力方面取得了显著进展。
272 6
|
1月前
|
SQL 存储 缓存
阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse
讲师焦明烨介绍了StarRocks的数据湖能力,如何使用阿里云EMR StarRocks构建基于Paimon的极速实时湖仓,StarRocks与Paimon的最新进展及未来规划。
123 3
|
1月前
|
SQL 存储 人工智能
阿里云日志服务的傻瓜式极易预测模型
预测服务有助于提前规划,减少资源消耗和成本。阿里云日志服务的AI预测服务简化了数学建模,仅需SQL操作即可预测未来指标,具备高准确性,并能处理远期预测。此外,通过ScheduledSQL功能,可将预测任务自动化,定时执行并保存结果。
69 3
|
1月前
|
监控 网络协议 CDN
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
|
3月前
|
分布式计算 大数据 MaxCompute
EMR Remote Shuffle Service实践问题之阿里云RSS的开源计划内容如何解决
EMR Remote Shuffle Service实践问题之阿里云RSS的开源计划内容如何解决
|
3月前
|
分布式计算 测试技术 调度
EMR Remote Shuffle Service实践问题之集群中落地阿里云RSS如何解决
EMR Remote Shuffle Service实践问题之集群中落地阿里云RSS如何解决
|
2月前
|
SQL 分布式计算 Serverless
阿里云 EMR Serverless Spark 版正式开启商业化
阿里云 EMR Serverless Spark 版正式开启商业化,内置 Fusion Engine,100% 兼容开源 Spark 编程接口,相比于开源 Spark 性能提升300%;提供 Notebook 及 SQL 开发、调试、发布、调度、监控诊断等一站式数据开发体验!
154 3
阿里云 EMR Serverless Spark 版正式开启商业化
|
2月前
|
SQL 存储 NoSQL
阿里云 EMR StarRocks 在七猫的应用和实践
本文整理自七猫资深大数据架构师蒋乾老师在 《阿里云 x StarRocks:极速湖仓第二季—上海站》的分享。
267 2
|
3月前
|
存储 分布式计算 大数据
大数据革新在即,阿里云EMR如何布局DeltaLake引领行业潮流?
【8月更文挑战第26天】大数据时代,实时处理与分析能力对企业至关重要。Delta Lake 作为高性能、可靠且支持 ACID 事务的开源存储层,已成为业界焦点。阿里云 EMR 深度布局 Delta Lake,计划深化集成、强化数据安全、优化实时性能,并加强生态建设与社区贡献。通过与 Spark 的无缝对接及持续的技术创新,阿里云 EMR 致力于提供更高效、安全的数据湖解决方案,引领大数据处理领域的发展新方向。
50 3
下一篇
无影云桌面