使用阿里云Elasticsearch快速搭建智能运维系统的课程笔记

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 了解阿里云Elasticsearch集群创建登录的基础操作学会采集系统数据和Nginx服务数据学会配置指标分析看板,体验数据分析和运维的过程

1. 创建资源
在页面右侧,单击创建资源,创建本次实验资源。Elasticsearch集群创建过程需要30分钟,请您耐心等待。漫长的等待,30多分钟。
2. 登录集群
在右侧远程桌面中打开浏览器,复制左侧云产品资源中提供的阿里云子用户名称和密码登录控制台。复制如下阿里云Elasticsearch控制台地址至浏览器地址栏,登录Elasticsearch控制台。说明:您可以在云产品资源列表查看已创建的资源信息,例如:IP地址、用户名、密码和资源所在地域等。
https://elasticsearch-cn-hangzhou.console.aliyun.com
说明:
本次实验已开通阿里云Elasticsearh6.8版本,仅做本次场景体验使用,如需作为测试环境或生产环境使用,可选择其他更高版本。
3. 登录Kibana,开启自动创建索引功能
在右侧概览页面Elasticsearch区域中,单击集群管理。在Elasticsearch实例列表中,单击实例ID。在左侧导航栏,选择配置与管理 > 可视化控制。在Kibana区域中,单击修改配置。开启Kibana私网访问,此变更过程需等待3-5分钟。返回上级页面,在Kibana区域中,单击公网入口。复制左侧云产品资源列表下的Elasticsearch登录名和Elasticsearch登录密码,至Kibana登录页面的账号和密码,单击登录。在登录成功页面,单击Explore on my own。
在左侧导航栏,单击Dev Tools(开发工具),再单击Go to work。在Console页签下,执行如下命令,开启阿里云ES实例的自动创建索引功能。PUT _cluster/settings
{
"persistent": {
"action.auto_create_index": "true" 
}
}
开启成功后,结果如下。
{
  "acknowledged" : true,
  "persistent" : {
    "action" : {
      "auto_create_index" : "true"
    }
  },
  "transient" : { }
}4. 使用Metricbeat采集ECS上的系统数据
返回阿里云Elasticsearch管理控制台,单击Beats数据采集 > 创建采集器。
在创建采集器窗口中,单击Metricbeat。
在系统弹出的确定服务授权对话框,单击确认,授权创建服务关联角色。
在采集器配置向导中,输入或选择采集器信息,复制左侧云产品资源列表下的Elasticsearch登录名和Elasticsearch登录密码,至用户名密码。
在metricbeat.yml中末尾添加如下脚本,单击下一步。
metricbeat.modules:
- module: system
  metricsets:
    - cpu             
    - load            
    - memory         
    - network        
    - process         
    - process_summary 
    - uptime          
    - socket_summary  
    - core
    - diskio 
    - filesystem
    - fsstat
  enabled: true
  period: 10s
  processes: ['.*']
  cpu.metrics:  ["percentages"]
  core.metrics: ["percentages"]
选择采集器安装的ECS实例。
启动采集器并查看采集器安装情况,此生效过程需等待3~5分钟。
单击启动。启动成功后,系统弹出启动成功对话框。单击前往采集中心查看,在采集器管理区域中,查看启动成功的Metricbeat采集器,等待采集器状态变为已生效1/1。返回Kibana页面,在左侧导航栏,单击Dev Tools(开发工具)。在Console页签下,执行如下命令,查看索引。GET _cat/indices?v索引创建成功后,结果如下。

在左侧导航栏,单击Dashboard,搜索[Metricbeat System] Overview。
单击进入[Metricbeat System] Overview页面,再单击Host Overview,可查看监控仪表板。
5. 使用Filebeat采集ECS上的Nginx服务数据
返回阿里云Elasticsearch管理控制台 > Beats数据采集中心。在创建采集器区域,将鼠标移至Filebeat上,单击ECS日志。
在采集器配置向导中,输入或选择采集器信息。完成后,单击下一步。在填写Filebeat文件目录处,填写如下路径:
/var/log/nginx/
在filebeat.yml中更改如下脚本。在第24行enabled更改为true。
在第28行更改paths:
- /var/log/nginx/*.log
单击下一步,选择采集器安装的ECS实例。
启动采集器并查看采集器安装情况,此生效过程需等待3~5分钟。单击启动。启动成功后,系统弹出启动成功对话框。单击前往采集中心查看,在采集器管理区域中,查看启动成功的Filebeat采集器,等待采集器状态变为已生效1/1。返回Kibana页面,在左侧导航栏,单击Dev Tools(开发工具)。在Console页签下,执行如下命令,查看索引。GET _cat/indices?v索引创建成功后,结果如下。

在左侧导航栏,单击Discover,点击选择filebeat,可查看采集的数据详情。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
6天前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
47 3
|
21天前
|
运维 Linux Apache
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
44 3
|
1天前
|
数据采集 机器学习/深度学习 运维
智能化运维在现代IT系统中的应用与挑战####
【10月更文挑战第29天】 本文探讨了智能化运维(AIOps)在现代IT系统中的重要作用及其面临的主要挑战。通过引入机器学习和大数据分析,智能化运维能显著提高系统稳定性、降低运营成本,并增强故障预测能力。然而,数据质量、技术整合及安全性等问题仍是其广泛应用的主要障碍。本文详细分析了这些挑战,并提出了相应的解决方案和未来发展趋势。 ####
13 5
|
3天前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
智能化运维:机器学习在故障预测和自动化响应中的应用
16 4
|
4天前
|
机器学习/深度学习 人工智能 运维
智能运维:AIOps在大型系统运维中的实践与挑战
【10月更文挑战第28天】随着云计算、大数据和人工智能的发展,AIOps(人工智能运维)应运而生,旨在通过算法和机器学习提高运维效率和质量。本文探讨了AIOps在大型系统运维中的实践与挑战,包括数据质量、模型选择和团队协作等方面,并通过一个异常检测案例展示了其应用。尽管面临挑战,AIOps仍有望成为未来运维的重要方向。
25 5
|
8天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI驱动下的IT运维革命###
本文探讨了人工智能(AI)技术在IT运维领域的创新应用,强调其在提升效率、预防故障及优化资源配置中的关键作用,揭示了智能运维的新趋势。 ###
|
5天前
|
运维 监控 中间件
数据中心运维监控系统产品价值与优势
华汇数据运维监控系统面向IT基础架构及IT支撑平台的监控和运维管理,包含监测、分析、展现和告警。监控范围涵盖了网络设备、主机系统、数据库、中间件和应用软件等。
19 4
|
6天前
|
机器学习/深度学习 运维 监控
智能运维未来:AIOps在预测性维护与故障排查中的潜力
【10月更文挑战第26天】随着数字化转型的深入,企业对IT系统的依赖日益增加。传统的运维方式已无法满足需求,智能运维(AIOps)应运而生。AIOps通过集成和分析多源数据,利用机器学习算法实现系统状态的实时监控和预测性维护,显著提升了运维效率和质量。 示例代码展示了如何使用Python和scikit-learn实现故障预测模型,进一步说明了AIOps的应用价值。
32 5
|
10天前
|
机器学习/深度学习 人工智能 运维
智能运维:大数据与AI的融合之道###
【10月更文挑战第20天】 运维领域正经历一场静悄悄的变革,大数据与人工智能的深度融合正重塑着传统的运维模式。本文探讨了智能运维如何借助大数据分析和机器学习算法,实现从被动响应到主动预防的转变,提升系统稳定性和效率的同时,降低了运维成本。通过实例解析,揭示智能运维在现代IT架构中的核心价值,为读者提供一份关于未来运维趋势的深刻洞察。 ###
60 10
|
4天前
|
机器学习/深度学习 人工智能 运维
智能化运维:提升IT服务效率的新引擎###
本文深入浅出地探讨了智能化运维(AIOps)如何革新传统IT运维模式,通过大数据、机器学习与自动化技术,实现故障预警、快速定位与处理,从而显著提升IT服务的稳定性和效率。不同于传统运维依赖人工响应,AIOps强调预测性维护与自动化流程,为企业数字化转型提供强有力的支撑。 ###