大数据||分布式部署常遇到的问题及基准测试

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 启动yarn时报错异常信息错误原因在启动子节点(senior02,senior03)时读取slaves时报错。原因是slaves文件有问题。

启动yarn时报错

  • 异常信息


  • 错误原因
    在启动子节点(senior02,senior03)时读取slaves时报错。原因是slaves文件有问题。字符编码的问题。

  • 解决方法
    1、重新创建slaves文件并初始化。touch slaves
    2、重新分发slaves文件到主节点resourcemanager

scp -r etc/hadoop/slaves hadoop-senior02.beifeng.com:/opt/app/hadoop-2.5.0/etc/hadoop/

  • 测试是否可以正常解析


子节点无法启动或者停止

  • 异常信息


  • 错误原因
    没有在slaves中配置子节点。

  • 解决方法
    修改slaves文件,添加子节点域名

集群环境下HDFS上传put文件出错

  • 异常信息


  • 错误原因
    复制文件到子节点时无法正常连接132和133子节点。因为防火墙拦截了请求。

  • 解决办法
    关闭防火墙
    重启后生效
    开启: chkconfig iptables on
    关闭: chkconfig iptables off
    即时生效,重启后失效
    开启: service iptables start
    关闭: service iptables stop

yarn启动认证失败

  • 异常信息


  • 失败原因
    yarn启动的时候需要启动子节点,如果没有设置rsa秘钥认证就会报错。
    两个linux机器之间使用ssh不需要用户名和密码,采用了数字签名RSA或者DSA来完成这个操作

  • 解决办法
    1、在resourceManager主节点生成加密文件

ssh-keygen -t rsa

2、复制公钥到子节点(131、133)

命令:
131节点:ssh-copy-id hadoop-senior.beifeng.com
133节点:ssh-copy-id hadoop-senior.beifeng.com

  • 测试是否可以免密登入

测试命令:
131节点:ssh hadoop-senior.beifeng.com
133节点:ssh hadoop-senior03.beifeng.com


测试结果

基本测试

集成搭建完成后对个服务进行集成测试。服务是否启动,是否可用

  • hdfs
    读写操作

bin/hdfs dfs -mkdir
bin/hdfs dfs -put
bin/hdfs dfs -text

  • yarn
    run jar
  • mapreduce
    bin/yarn jar

基准测试

基准测试是测试集群的性能,

  • 针对hdfs来说 读数据和写数据。压读写速度,测试网络传播速度。测试hdsf的namenode可以管理多少元数据。

  • yarn map的增加或者减少

监控集群软件

  • cloudera Manager :辅助我们部署安装和监控集群、配置、同步、预警等。
相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
4月前
|
监控 Linux 应用服务中间件
Linux多节点多硬盘部署MinIO:分布式MinIO集群部署指南搭建高可用架构实践
通过以上步骤,已成功基于已有的 MinIO 服务,扩展为一个 MinIO 集群。该集群具有高可用性和容错性,适合生产环境使用。如果有任何问题,请检查日志或参考MinIO 官方文档。作者联系方式vx:2743642415。
1222 57
|
7月前
|
Java 关系型数据库 MySQL
新一代 Cron-Job分布式任务调度平台 部署指南
简单易用、超低延迟,支持用户权限管理、多语言客户端和多租户接入的分布式任务调度平台。 支持任何Cron表达式的任务调度,支持常用的分片和随机策略;支持失败丢弃、失败重试的失败策略;支持动态任务参数。
209 101
|
5月前
|
SQL 数据可视化 网络安全
YashanDB分布式可视化部署
本文介绍YashanDB的分布式部署流程,涵盖服务端安装、数据库基本信息与服务器配置、节点信息设置、建库参数调整、环境变量配置及安装结果检查等步骤。通过可视化Web界面操作,详细说明了各环节配置方法和注意事项,确保用户顺利完成数据库集群的搭建与初始化设置。适用于需要分布式数据库部署的场景,提供全面的操作指导。
YashanDB分布式可视化部署
|
6月前
|
运维 Kubernetes Java
Koupleless 助力「人力家」实现分布式研发集中式部署,又快又省!
本文由仁励家网络科技(杭州)有限公司架构师赵云兴、葛志刚撰写,探讨了公司在优化HR SaaS解决方案时遇到的系统资源浪费和运维成本高的问题。通过引入Koupleless框架,成功将模块体积从500M缩减至5M以下,部署时间从6分钟缩短至3分钟,并大幅节省服务器资源。文章详细介绍了Koupleless的部署方案及优化措施,感谢Koupleless团队的专业支持,使人力家实现了多应用合并部署,降低了运维成本。
Koupleless 助力「人力家」实现分布式研发集中式部署,又快又省!
|
8月前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试
|
6月前
|
运维 Kubernetes Java
Koupleless 助力「人力家」实现分布式研发集中式部署,又快又省!
通过引入Koupleless框架,解决了多应用部署中资源浪费和运维成本高的问题,实现了模块瘦身、快速部署及流量控制优化,大幅降低了服务器资源占用和发布耗时,提升了系统稳定性和运维效率。最终,人力家成功实现了多应用的轻量集中部署,显著减少了运维成本。
 Koupleless 助力「人力家」实现分布式研发集中式部署,又快又省!
|
7月前
|
人工智能 Kubernetes 异构计算
大道至简-基于ACK的Deepseek满血版分布式推理部署实战
大道至简-基于ACK的Deepseek满血版分布式推理部署实战
372 5
|
7月前
|
人工智能 Kubernetes 异构计算
大道至简-基于ACK的Deepseek满血版分布式推理部署实战
本教程演示如何在ACK中多机分布式部署DeepSeek R1满血版。
|
8月前
|
数据采集 人工智能 分布式计算
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
阿里云推出的MaxFrame是链接大数据与AI的分布式Python计算框架,提供类似Pandas的操作接口和分布式处理能力。本文从部署、功能验证到实际场景全面评测MaxFrame,涵盖分布式Pandas操作、大语言模型数据预处理及企业级应用。结果显示,MaxFrame在处理大规模数据时性能显著提升,代码兼容性强,适合从数据清洗到训练数据生成的全链路场景...
364 5
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!