【最佳实践】《微服务架构日志采集运维管理》手把手实操步骤与常见问题

简介: 根据阿里云《微服务架构日志采集运维管理》最佳实践文档实践步骤复现应用搭建的过程,同时总结归纳部分在应用搭载过程中遇见的问题与解决方案。

前提概要

场景描述:阿里云日志服务(SLS)结合Kubernetes日志特点以及应用场景,提供全方位的容器微服务应用环境下的日志采集、处理以及分析的实践。

产品列表:容器服务 Kubernetes 版、日志服务 SLS、专有网络 VPC、负载均衡 SLB、弹性计算 ECS、容器镜像服务 ACR、云数据库 RDS 版、智能解析 DNS。

解决问题:

  1. 容器微服务架构下日志采集困难;
  2. 日志采集 Agent 资源消耗多;
  3. 运维日志平台系统成本代价高;
  4. 日志分析方式少,日志分析不方便。

实践方案架构:


方案价值:

  1. 基于 Logtail 一键完成安装,CRD 扩展,与 K8S 部署管理方式无缝集成;
  2. 日志服务为 Ingress 提供可视化分析报表;
  3. 简化 Ingress 日志分析与监控的门槛。

日志采集部署建议:

  1. 核心应用:使用 SideCar 方式采集;
  2. 普通应用/系统日志:使用 DaemonSet 方式采集;
  3. 标准输出: 使用 DaemonSet 方式采集。



常见问题

CADT创建资源校验失败怎么办?

  1. 确定各个产品的权限已开通;
  2. 创建VPC网络与ACK的Service CIDR不能有网段交叉,以下为我创建时填写的参数,仅供参考:
  1. ACK的网段设置
  1. Pod 网络 CIDR:10.30.0.0/16
  2. Service CIDR:172.16.0.0/16

CADT资源创建成功后资源状态却又改为已删除?

  1. 确认选中的Region、AZ有无对应规格与资源;
  2. 确认对应资源名称是否已被占用,需要保证SLS等产品的名称变量全局唯一。

配置RDS 数据库需要注意什么?

  1. 配置RDS的白名单为VPC的网段,使得VPC内的设备实例可以访问该RDS。

  1. 配置RDS为企业版才可完成后续第10章RDS审计日志采集分析与监控的操作。

如何在容器中以VNC方式配置docker环境?

  1. 下载update:yum update

  1. 环境配置:docker-ce环境安装

步骤1:下载repo文件:curl https://download.docker.com/linux/centos/docker-ce.repo -o /etc/yum.repos.d/docker-ce.repo

步骤2:安装containerd.io依赖:yum -y install https://download.docker.com/linux/fedora/30/x86_64/stable/Packages/containerd.io-1.2.6-3.3.fc30.x86_64.rpm

步骤3:下载docker-ce版本:yum -y install docker-ce


步骤4:启动docker并检查是否版本是否为ce版本

  • 启动docker服务:systemctl start docker
  • 将docker加入开机启动:systemctl enable docker
  • 重新加载docker服务程序配置文件:systemctl daemon-reload
  • 查看docker版本:docker version

如何在Docker中拉取镜像以及常见问题?

  1. 拉取原始镜像:docker pull wordpress

  1. 获取镜像ID与镜像版本:docker images | grep wordpress

易得镜像ID:5f9d748595e1,镜像版本:v1.0。

  1. 登陆镜像仓库并推送镜像

步骤1:登录阿里云Docker Registry:docker login --username=*****@test.aliyunid.com registry.cn-hangzhou.aliyuncs.com

ps****为阿里云账号前缀

步骤2:给镜像打标签:docker tag {镜像ID} registry.cn-hangzhou.aliyuncs.com/{镜像仓库命名空间}/{镜像仓库名称}:{版本号}

步骤3:将镜像推送到Registry:sudo docker push registry.cn-hangzhou.aliyuncs.com/{镜像仓库命名空间}/{镜像仓库名称}:{版本号}

ps:填写时需要删除{}

  1. 常见问题
  • docker login:提示host不存在:给镜像仓库开通公网访问权限
  • 提示volume不存在:更换namespace

拉取镜像时下载速度很慢或中途连接直接断掉拉取失败?

问题原因:docker的wordpress官方镜像源在国外,下载时网络质量极差,甚至中断。

解决方案:修改拉取镜像的json配置文件,镜像源改为阿里云国内网址。

  1. 在对应容器节点中远程登录实例,在/etc/docker/路径下创建vim daemon.json文件,文件内容如下:

{

"registry-mirrors": ["https://oojjt1xs.mirror.aliyuncs.com"]

}

  1. 再次执行docker pull wordpress命令即可快速下载拉取

根据镜像搭建无状态应用报错ErrImagePull && ImagePullBackOff?

问题原因:没有配置对应镜像拉取策略。

参考文档:使用免密组件配置镜像拉取策略

解决方案:

  1. 升级/安装aliyun-acr-credential-helper组件
  1. 在容器控制台集群列表页面,单击目标集群操作列下的更多 > 系统组件管理
  2. 在安全区域,找到aliyun-acr-credential-helper,单击升级
  1. 通过控制台方式设置acr-configuration配置项
  1. 在容器集群信息页面左侧导航栏,选择配置管理 > 配置项,在上方命名空间下拉框中选择kube-system,找到配置项acr-configuration
  2. 通过以下两种方式配置acr-configuration
  1. 方式一:单击其右侧的编辑,设置配置项键和值
  1. 如果您没有acr-configuration配置项,请参见创建配置项。关于如何更新配置项,请参见修改配置项
  1. 方式二:单击其右侧的YAML编辑,设置配置项键和值

搭建应用后访问路由地址显示Error establishing a database connection?

问题描述:无状态应用创建成功,但是用路由器Ingress提供的域名无法访问wordpress网页,会出现无法连接数据库的错误。

问题原因:由于wordpress的配置文件的yaml文件未配置环境变量导致的,配置数据库有关的环境变量后即可以连接上去。

解决方法:

步骤一:前往RDS数据库控制台,找到自己创建的数据库,点击左边目录栏的“数据库连接”,复制内网地址。

步骤二:继续点击数据库管理,记录数据库的名称、用户名。


步骤三:前往ACK容器管理控制台,点击进入自己创建的集群,点击进入自己创建的无状态应用中,点击查看Yaml


找到yaml文件中,配置环境变量的那一部分文件(可以看到-name,-value的那部分文件)在里面加上自己数据库的环境变量。


- name: WORDPRESS_DB_HOST
              value: '步骤一中复制的数据库的内网地址:3306'
            - name: WORDPRESS_DB_NAME
              value: 步骤二中记录的数据库的名称
            - name: WORDPRESS_DB_USER
              value: 步骤二中绑定账户的名称
            - name: WORDPRESS_DB_PASSWORD
              value: 账户对应的密码

修改后的结果,具体示意如下,修改完成后点击更新,耐心等待一会(半分钟)即可。

image.png

参考文献

微服务架构日志采集运维管理最佳实践

相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
6月前
|
监控 算法 NoSQL
Go 微服务限流与熔断最佳实践:滑动窗口、令牌桶与自适应阈值
🌟蒋星熠Jaxonic:Go微服务限流熔断实践者。分享基于滑动窗口、令牌桶与自适应阈值的智能防护体系,助力高并发系统稳定运行。
Go 微服务限流与熔断最佳实践:滑动窗口、令牌桶与自适应阈值
|
7月前
|
数据可视化 Java BI
将 Spring 微服务与 BI 工具集成:最佳实践
本文探讨了 Spring 微服务与商业智能(BI)工具集成的潜力与实践。随着微服务架构和数据分析需求的增长,Spring Boot 和 Spring Cloud 提供了构建可扩展、弹性服务的框架,而 BI 工具则增强了数据可视化与实时分析能力。文章介绍了 Spring 微服务的核心概念、BI 工具在企业中的作用,并深入分析了两者集成带来的优势,如实时数据处理、个性化报告、数据聚合与安全保障。同时,文中还总结了集成过程中的最佳实践,包括事件驱动架构、集中配置管理、数据安全控制、模块化设计与持续优化策略,旨在帮助企业构建高效、智能的数据驱动系统。
364 1
将 Spring 微服务与 BI 工具集成:最佳实践
|
10月前
|
消息中间件 运维 监控
企业级短信验证码服务架构设计与最佳实践
随着移动互联网的发展,短信验证码成为用户身份验证的重要手段。本文从企业级应用角度出发,探讨如何构建高可用、高并发和安全可靠的短信验证码服务。通过多通道冗余、故障自动切换和服务降级保障高可用性;利用异步处理与消息队列应对高并发;借助多层防刷、内容审核和数据加密提升安全性。同时,提供了详细的架构设计、核心模块代码示例以及监控运维方案,帮助读者理解并实现一个完整的短信验证码系统。
513 2
|
7月前
|
Prometheus 监控 Java
日志收集和Spring 微服务监控的最佳实践
在微服务架构中,日志记录与监控对系统稳定性、问题排查和性能优化至关重要。本文介绍了在 Spring 微服务中实现高效日志记录与监控的最佳实践,涵盖日志级别选择、结构化日志、集中记录、服务ID跟踪、上下文信息添加、日志轮转,以及使用 Spring Boot Actuator、Micrometer、Prometheus、Grafana、ELK 堆栈等工具进行监控与可视化。通过这些方法,可提升系统的可观测性与运维效率。
652 1
日志收集和Spring 微服务监控的最佳实践
|
6月前
|
存储 监控 安全
132_API部署:FastAPI与现代安全架构深度解析与LLM服务化最佳实践
在大语言模型(LLM)部署的最后一公里,API接口的设计与安全性直接决定了模型服务的可用性、稳定性与用户信任度。随着2025年LLM应用的爆炸式增长,如何构建高性能、高安全性的REST API成为开发者面临的核心挑战。FastAPI作为Python生态中最受青睐的Web框架之一,凭借其卓越的性能、强大的类型安全支持和完善的文档生成能力,已成为LLM服务化部署的首选方案。
1096 3
|
7月前
|
负载均衡 监控 安全
5 个 IIS 日志记录最佳实践
IIS日志记录是监控Web服务器性能与安全的关键。本文介绍启用日志、应用池配置、负载均衡、敏感数据防护、日志集中管理及保留策略等五大最佳实践,助力高效分析与合规审计。
399 1
|
11月前
|
监控 容灾 算法
阿里云 SLS 多云日志接入最佳实践:链路、成本与高可用性优化
本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS),解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent(iLogtail/LoongCollector)在海外场景的应用,推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案,包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等,并提供了成本优化策略和多目标发送配置指导,帮助企业构建稳定、低成本、高可用的全球日志系统。
1060 54
|
9月前
|
Ubuntu 编译器 C语言
在Ubuntu22.04平台上交叉编译针对Rv1126架构的GCC13.2.0编译器的步骤。
遵循上述步骤,您应该能够在Ubuntu 22.04平台上成功交叉编译适用于RISC-V架构RV1126的GCC 13.2.0编译器,允许您为目标硬件构建应用程序和操作系统组件。
556 10
|
12月前
|
监控 安全 BI
优化 Apache 日志记录的 5 个最佳实践
Apache 日志记录对于维护系统运行状况和网络安全至关重要,其核心包括访问日志与错误日志的管理。通过制定合理的日志策略,如选择合适的日志格式、利用条件日志减少冗余、优化日志级别、使用取证模块提升安全性及实施日志轮换,可有效提高日志可用性并降低系统负担。此外,借助 Eventlog Analyzer 等专业工具,能够实现日志的高效收集、可视化分析与威胁检测,从而精准定位安全隐患、评估服务器性能,并满足合规需求,为强化网络安全提供有力支持。
303 0
优化 Apache 日志记录的 5 个最佳实践