使用阿里云日志服务采集查询kubernetes容器日志

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 使用阿里云日志收集查询kubernetes容器日志

[TOC]

使用阿里云日志服务采集查询kubernetes容器日志

概述

在使用阿里云日志服务之前,我们自建了graylog服务,使用了3台服务器。
使用阿里云日志服务之后,按量付费,每月不到20元,相比使用前,费用节省比较多,也减少了自建日志服务的维护成本。
根据阿里云的监控数据,大概每秒写入500行日志。
从实际使用效果看,对于各环境日志查询,阿里云日志服务能够很好的满足需求。
下面主要讲讲配置细节。

创建日志库

可参考创建日志库

创建logtail机器组和logtail配置

参考logtail采集概述
在此处我创建了两个log配置,一个是采集/var/log目录下的所有.log;另一个是采集/logs/.log,见下图,具体的配置可参考阿里云官方文档[logtail收集日志](https://help.aliyun.com/document_detail/28967.html?spm=5176.doc28979.2.11.lAWnv0)。
logtail配置图:
logconfigs
logtail机器组:
loggroup

创建logtail镜像

因为我所在的区域是华东2,使用的是VPC网络,安装时会地域使用cn_shanghai_vpc。
使用的logtail.sh脚本是:http://logtail-release-sh.vpc100-oss-cn-shanghai.aliyuncs.com/linux64/logtail.sh
package所在地址为:http://logtail-release-sh.vpc100-oss-cn-shanghai.aliyuncs.com/linux64/logtail-linux64.tar.gz
user_defined_id为你在之前步骤中配置的机器组用户自定义标识
${account_id} 需要更换为你的阿里云帐号id
Dockerfile内容如下

From registry.cn-shanghai.aliyuncs.com/acs/ilogtail:0.12.1-5dcc770
COPY logtail.sh /logtail.sh
COPY logtail-linux64.tar.gz /logtail-linux64.tar.gz
RUN chmod +x /logtail.sh
RUN sh /logtail.sh install cn_shanghai_vpc
COPY docker_run.sh /usr/local/ilogtail/docker_run.sh
COPY user_defined_id /etc/ilogtail/user_defined_id
RUN mkdir -p /etc/ilogtail/users
RUN touch /etc/ilogtail/users/${account_id}
RUN cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
AI 代码解读

docker_run.sh内容如下,只是修改了默认区域:

#!/bin/bash

default_log_region='cn_shanghai_vpc'
if [ "$log_region" = "" ];then
    log_region=$default_log_region
fi
cp /usr/local/ilogtail/conf/$log_region/ilogtail_config.json /usr/local/ilogtail/ilogtail_config.json

service ilogtaild start

exit_handle()
{
    service ilogtaild stop
    exit 0
}

trap 'exit_handle' SIGTERM

if [ "$swarm_mode" == "true" ]; then
    exec /usr/local/bin/link_volumes
else
    while true
    do
        sleep 10
    done
fi
AI 代码解读

根据此dockerfile,生成需要的镜像。

配置kubernetes pod

在kubernetes pod manifest中使用容器之间共享volumn的方式来让logtail收集应用的日志,为了能够在日志查询时区分是哪个应用来的日志,日志挂载目录为:/logs/APP_NAME/ENV_TYPE_VALUE
详细manifest如下:

kind: Deployment
apiVersion: extensions/v1beta1
metadata:
  labels:
    app: APP_NAME
  name: APP_NAME
  namespace: ENV_TYPE_VALUE
spec:
  replicas: REPLICA_NUM
  selector:
    matchLabels:
      app: APP_NAME
  template:
    metadata:
      labels:
        app: APP_NAME
    spec:
      nodeSelector:
        node-type: slave
      containers:
      - name: APP_NAME
        image: IMAGE_REF
        resources:
          limits:
            cpu: CPU_LIMIT
            memory: MEMORY_LIMIT
        ports:
        - containerPort: APP_PORT
          protocol: TCP
        env:
          - name: TZ
            value: Asia/Shanghai
          - name: ENV_TYPE
            value: ENV_TYPE_VALUE
          - name: POD_NAME
            value: POD_NAME_VALUE
          - name: BUILD_ID
            value: BUILD_ID_VALUE
        livenessProbe:
          httpGet:
            path: HTTP_PATH
            port: APP_PORT
            httpHeaders:
            - name: "Authorization"
              value: "HTTP_BASIC_AUTH"
        readinessProbe:
          httpGet:
            path: HTTP_PATH
            port: APP_PORT
            httpHeaders:
            - name: "Authorization"
              value: "HTTP_BASIC_AUTH"
        volumeMounts:
          # name must match the volume name below
          - name: app-log
            mountPath: /logs
            readOnly: false
      - name: logtail
        image: registry-vpc.cn-shanghai.aliyuncs.com/jfdevops/ilogtail:0.12.7
        env:
          - name: TZ
            value: Asia/Shanghai
          - name: ENV_TYPE
            value: ENV_TYPE_VALUE
          - name: POD_NAME
            value: POD_NAME_VALUE
        volumeMounts:
          - name: app-log
            mountPath: /logs/APP_NAME/ENV_TYPE_VALUE
      volumes:
      - name: app-log
        emptyDir:
          medium: ""
AI 代码解读

最终显示效果如图:
logview

可以使用__tag__:__path__: /logs/APP_NAME/ENV_TYPE_VALUE/*搜索ENV_TYPE_VALUE下的应用APP_NAME的日志。

logtail性能情况

在上述模式下,每个pod都会起一个logtail的容器,其是否为影响其它服务的性能呢?
在目前的量能情况下,一台4C16G的服务器logtail只占20M,0.02个CPU,几乎没有影响,即使再上升10倍也是可以接受的。

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
目录
打赏
0
0
0
0
1
分享
相关文章
什么是Apache日志?为什么Apache日志分析很重要?
Apache是全球广泛使用的Web服务器软件,支持超过30%的活跃网站。它通过接收和处理HTTP请求,与后端服务器通信,返回响应并记录日志,确保网页请求的快速准确处理。Apache日志分为访问日志和错误日志,对提升用户体验、保障安全及优化性能至关重要。EventLog Analyzer等工具可有效管理和分析这些日志,增强Web服务的安全性和可靠性。
ACK Edge与IDC:高效容器网络通信新突破
本文介绍如何基于ACK Edge以及高效的容器网络插件管理IDC进行容器化。
正式开源,Doris Operator 支持高效 Kubernetes 容器化部署方案
飞轮科技推出了 Doris 的 Kubernetes Operator 开源项目(简称:Doris Operator),并捐赠给 Apache 基金会。该工具集成了原生 Kubernetes 资源的复杂管理能力,并融合了 Doris 组件间的分布式协同、用户集群形态的按需定制等经验,为用户提供了一个更简洁、高效、易用的容器化部署方案。
正式开源,Doris Operator 支持高效 Kubernetes 容器化部署方案
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
针对本地存储和 PVC 这两种容器存储使用方式,我们对 ACK 的容器存储监控功能进行了全新升级。此次更新完善了对集群中不同存储类型的监控能力,不仅对之前已有的监控大盘进行了优化,还针对不同的云存储类型,上线了全新的监控大盘,确保用户能够更好地理解和管理容器业务应用的存储资源。
ACK容器监控存储全面更新:让您的应用运行更稳定、更透明
介绍升级之后的ACK容器监控体系,包括各大盘界面展示和概要介绍。
MySQL事务日志-Undo Log工作原理分析
事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
MySQL事务日志-Undo Log工作原理分析
容器化时代的领航者:Docker 和 Kubernetes 云原生时代的黄金搭档
Docker 是一种开源的应用容器引擎,允许开发者将应用程序及其依赖打包成可移植的镜像,并在任何支持 Docker 的平台上运行。其核心概念包括镜像、容器和仓库。镜像是只读的文件系统,容器是镜像的运行实例,仓库用于存储和分发镜像。Kubernetes(k8s)则是容器集群管理系统,提供自动化部署、扩展和维护等功能,支持服务发现、负载均衡、自动伸缩等特性。两者结合使用,可以实现高效的容器化应用管理和运维。Docker 主要用于单主机上的容器管理,而 Kubernetes 则专注于跨多主机的容器编排与调度。尽管 k8s 逐渐减少了对 Docker 作为容器运行时的支持,但 Doc
154 5
容器化时代的领航者:Docker 和 Kubernetes 云原生时代的黄金搭档
入门级容器技术解析:Docker和K8s的区别与关系
本文介绍了容器技术的发展历程及其重要组成部分Docker和Kubernetes。从传统物理机到虚拟机,再到容器化,每一步都旨在更高效地利用服务器资源并简化应用部署。容器技术通过隔离环境、减少依赖冲突和提高可移植性,解决了传统部署方式中的诸多问题。Docker作为容器化平台,专注于创建和管理容器;而Kubernetes则是一个强大的容器编排系统,用于自动化部署、扩展和管理容器化应用。两者相辅相成,共同推动了现代云原生应用的快速发展。
97 11
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
容器服务Kubernetes场景下可观测体系生产级最佳实践
阿里云容器服务团队在2024年继续蝉联Gartner亚洲唯一全球领导者象限,其可观测体系是运维的核心能力之一。该体系涵盖重保运维、大规模集群稳定性、业务异常诊断等场景,特别是在AI和GPU场景下提供了全面的观测解决方案。通过Tracing、Metric和Log等技术,阿里云增强了对容器网络、存储及多集群架构的监控能力,帮助客户实现高效运维和成本优化。未来,结合AI助手,将进一步提升问题定位和解决效率,缩短MTTR,助力构建智能运维体系。

相关产品

  • 容器服务Kubernetes版
  • AI助理

    你好,我是AI助理

    可以解答问题、推荐解决方案等