大数据||分布式部署常遇到的问题及基准测试

简介: 启动yarn时报错异常信息错误原因在启动子节点(senior02,senior03)时读取slaves时报错。原因是slaves文件有问题。

启动yarn时报错

  • 异常信息


  • 错误原因
    在启动子节点(senior02,senior03)时读取slaves时报错。原因是slaves文件有问题。字符编码的问题。

  • 解决方法
    1、重新创建slaves文件并初始化。touch slaves
    2、重新分发slaves文件到主节点resourcemanager

scp -r etc/hadoop/slaves hadoop-senior02.beifeng.com:/opt/app/hadoop-2.5.0/etc/hadoop/

  • 测试是否可以正常解析


子节点无法启动或者停止

  • 异常信息


  • 错误原因
    没有在slaves中配置子节点。

  • 解决方法
    修改slaves文件,添加子节点域名

集群环境下HDFS上传put文件出错

  • 异常信息


  • 错误原因
    复制文件到子节点时无法正常连接132和133子节点。因为防火墙拦截了请求。

  • 解决办法
    关闭防火墙
    重启后生效
    开启: chkconfig iptables on
    关闭: chkconfig iptables off
    即时生效,重启后失效
    开启: service iptables start
    关闭: service iptables stop

yarn启动认证失败

  • 异常信息


  • 失败原因
    yarn启动的时候需要启动子节点,如果没有设置rsa秘钥认证就会报错。
    两个linux机器之间使用ssh不需要用户名和密码,采用了数字签名RSA或者DSA来完成这个操作

  • 解决办法
    1、在resourceManager主节点生成加密文件

ssh-keygen -t rsa

2、复制公钥到子节点(131、133)

命令:
131节点:ssh-copy-id hadoop-senior.beifeng.com
133节点:ssh-copy-id hadoop-senior.beifeng.com

  • 测试是否可以免密登入

测试命令:
131节点:ssh hadoop-senior.beifeng.com
133节点:ssh hadoop-senior03.beifeng.com


测试结果

基本测试

集成搭建完成后对个服务进行集成测试。服务是否启动,是否可用

  • hdfs
    读写操作

bin/hdfs dfs -mkdir
bin/hdfs dfs -put
bin/hdfs dfs -text

  • yarn
    run jar
  • mapreduce
    bin/yarn jar

基准测试

基准测试是测试集群的性能,

  • 针对hdfs来说 读数据和写数据。压读写速度,测试网络传播速度。测试hdsf的namenode可以管理多少元数据。

  • yarn map的增加或者减少

监控集群软件

  • cloudera Manager :辅助我们部署安装和监控集群、配置、同步、预警等。
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
12月前
|
数据采集 人工智能 分布式计算
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
阿里云推出的MaxFrame是链接大数据与AI的分布式Python计算框架,提供类似Pandas的操作接口和分布式处理能力。本文从部署、功能验证到实际场景全面评测MaxFrame,涵盖分布式Pandas操作、大语言模型数据预处理及企业级应用。结果显示,MaxFrame在处理大规模数据时性能显著提升,代码兼容性强,适合从数据清洗到训练数据生成的全链路场景...
618 5
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
|
12月前
|
人工智能 分布式计算 大数据
MaxFrame 产品评测:大数据与AI融合的Python分布式计算框架
MaxFrame是阿里云MaxCompute推出的自研Python分布式计算框架,支持大规模数据处理与AI应用。它提供类似Pandas的API,简化开发流程,并兼容多种机器学习库,加速模型训练前的数据准备。MaxFrame融合大数据和AI,提升效率、促进协作、增强创新能力。尽管初次配置稍显复杂,但其强大的功能集、性能优化及开放性使其成为现代企业与研究机构的理想选择。未来有望进一步简化使用门槛并加强社区建设。
536 8
|
12月前
|
SQL 分布式计算 DataWorks
MaxCompute MaxFrame评测 | 分布式Python计算服务MaxFrame(完整操作版)
在当今数字化迅猛发展的时代,数据信息的保存与分析对企业决策至关重要。MaxCompute MaxFrame是阿里云自研的分布式计算框架,支持Python编程接口、兼容Pandas接口并自动进行分布式计算。通过MaxCompute的海量计算资源,企业可以进行大规模数据处理、可视化数据分析及科学计算等任务。本文将详细介绍如何开通MaxCompute和DataWorks服务,并使用MaxFrame进行数据操作。包括创建项目、绑定数据源、编写PyODPS 3节点代码以及执行SQL查询等内容。最后,针对使用过程中遇到的问题提出反馈建议,帮助用户更好地理解和使用MaxFrame。
|
机器学习/深度学习 分布式计算 数据挖掘
MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎
MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。
275 6
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
471 2
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
1605 6
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
|
SQL 分布式计算 NoSQL
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
337 4
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
501 1