场景体验报告——冬季实战营第五期

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: 第五期为大数据的实战,主要介绍了阿里云EMR集群、Elasticsearch集群和湖仓一体架构。对大数据的学习有一定的入门作用。

基于EMR离线数据分析


一、登录集群

  1. 进入E-MapReduce控制台,选择对应的集群,在主机信息中复制公网IP,打开LxShell。
  2. 使用ssh命令登录。

二、上传数据到HDFS

  1. 执行如下命令,创建HDFS目录。

hdfs dfs -mkdir -p /data/student

  1. 上传文件到hadoop文件系统。

三、使用hive创建表

  1. 使用hive命令登录hive数据库。
  2. 使用SQL语句创建表。
  3. 执行如下命令,从hadoop文件系统加载数据到hive数据表。

LOAD DATA INPATH '/data/student/u.txt' INTO TABLE emrusers;

四、对表进行操作

使用SQL语句操作即可。

使用阿里云Elasticsearch快速搭建智能运维系统


一、登录Kibana,开启自动创建索引功能

  1. 在Elasticsearch控制台实例列表中,进入对应实例。
  2. 在“可视化控制”的Kibana中,开启私网访问。
  3. 从公网入口进入Kibana,使用Elasticsearch登录名和密码登录。
  4. 登录成功后,在Dev Tools单击Go to work
  5. 执行以下命令,开启ES实例的自动创建所以功能。

PUT _cluster/settings

{

    "persistent": {

        "action.auto_create_index": "true"

    }

}

二、使用Metricbeat采集ECS上的系统数据

  1. 回到控制台,单击Beats数据采集 > 创建采集器 > Metricbeat。
  2. 用户名和密码使用资源中提供的Elasticsearch登录名Elasticsearch登录密码
  3. 勾选启用Monitoring和Kibana Dashboard。
  4. 在metricbeat.yml末尾添加如下脚本:

metricbeat.modules:

- module: system

 metricsets:

   - cpu            

   - load            

   - memory        

   - network        

   - process        

   - process_summary

   - uptime          

   - socket_summary  

   - core

   - diskio

   - filesystem

   - fsstat

 enabled: true

 period: 10s

 processes: ['.*']

 cpu.metrics:  ["percentages"]

 core.metrics: ["percentages"]

  1. 点击下一步,采集器选择场景中的ECS实例,点击启动,然后等待采集器生效。
  2. 回到Kibana页面,在Dev Tools中执行以下命令,查看索引。

GET _cat/indices?v

  1. Dashboard中,进入[Metricbeat System] Overview页面,再单击Host Overview,可查看监控仪表板。

三、使用Filebeat采集ECS上的Nginx服务数据

  1. 回到Beats数据采集中心,选择Filebeat-ECS日志,开始创建采集器。
  2. 填写Filebeat文件目录输入以下路径:

/var/log/nginx/

  1. 修改filebeat.yml文件。
  2. 完成采集器的创建,并回到Kibana页面,在Dev Tools中执行以下命令,查看索引:

GET _cat/indices?v

  1. 索引创建成功后,在Discover-filebeat可以查看采集的数据详情。
相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
存储 Kubernetes 应用服务中间件
当SRS遇到K8s:快速构建高并发直播集群
流媒体服务和流媒体服务器的关键差异是什么?高效的运维能力是其中极其关键的差异之一,云计算 +Docker+K8s 让开源项目也能拥有这种能力,让每个人都能具备互联网流媒体服务能力,正如:旧时王谢堂前燕,飞入寻常百姓家!
1412 0
当SRS遇到K8s:快速构建高并发直播集群
|
SQL Java 关系型数据库
SpringBoot从入门到精通(三十)如何使用JdbcTemplate操作数据库?
前面介绍了Mybatis数据持久化框架,Mybatis虽然功能强大,但是,使用起来还是比较复杂的。所以接下来介绍一个简单的数据持久化框架——JdbcTemplate。
10351 2
SpringBoot从入门到精通(三十)如何使用JdbcTemplate操作数据库?
|
8月前
|
负载均衡 监控 安全
优化HTTP代理IP安全稳定性的关键要点
随着科技发展,越来越多企业依赖HTTP代理IP。为确保其安全稳定,建议采取以下措施:选择可靠服务商、使用HTTPS加密、定期更换IP、监控可用性、设置访问控制、使用负载均衡、配置防火墙、定期更新维护及用户教育。这些方法能有效提升代理IP的安全性和稳定性。
344 59
|
7月前
|
Arthas 监控 前端开发
Arthas tt(方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测)
Arthas tt(方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测)
190 7
|
Android开发
Android开发表情emoji功能开发
本文介绍了一种在Android应用中实现emoji表情功能的方法,通过将图片与表情字符对应,实现在`TextView`中的正常显示。示例代码展示了如何使用自定义适配器加载emoji表情,并在编辑框中输入或删除表情。项目包含完整的源码结构,可作为开发参考。视频演示和源码详情见文章内链接。
301 4
Android开发表情emoji功能开发
|
10月前
开放·连接 ”2025玄铁 RISC-V 生态大会今日启动报名!
开放·连接 ”2025玄铁 RISC-V 生态大会今日启动报名
992 13
|
机器学习/深度学习 人工智能 自然语言处理
探索AI技术:从基础原理到实际应用的全面剖析
本文旨在为读者提供关于人工智能(AI)技术的全面了解。从探讨AI的基本概念和关键技术入手,逐步深入到AI在不同领域的应用实例,包括医疗、金融和自动驾驶等。同时,文章也详细讨论了当前AI技术面临的伦理问题和社会影响,以及可能的解决方案。最后,本文还展望了AI技术未来的发展趋势,帮助读者更好地理解这一前沿科技的现状与未来。
929 5
Snipaste 截图悬浮工具【实用教程】
Snipaste 截图悬浮工具【实用教程】
809 0
|
Kubernetes Ubuntu Docker
Kubernetes 审计(Auditing)
在 Kubernetes 1.22.2 环境中实施审计策略可以帮助管理员监控和记录集群中的资源操作,确保集群的安全性和符合性。通过启用审计 Admission Controller 和配置相应的审计策略,我们可以灵活地控制审计记录的格式和范围。 致力于一条龙式的为您解决问题
225 0
|
存储 机器学习/深度学习 大数据
云计算与大数据:合作与创新
本文探讨了大数据技术与云计算的背景和发展,大数据的5V特征(量、速度、多样、复杂、不确定)及云计算的3S特点(服务、共享、可扩展)。两者相互依赖,云计算为大数据提供计算与存储资源。核心算法涉及分布式计算、数据挖掘和机器学习,如线性回归、逻辑回归等。通过代码示例展示了Hadoop的MapReduce、Scikit-learn的KNN和TensorFlow的线性回归应用。未来趋势包括数据量增长、实时处理、AI与ML集成及数据安全挑战。附录解答了大数据、云计算等相关问题。
797 3