Hadoop

首页 标签 Hadoop
# Hadoop #
关注
10933内容
|
3天前
|
hadoop配置文件参数
hadoop配置文件参数【2月更文挑战第13天】
|
3天前
|
Hadoop节点线缆连接检查
【5月更文挑战第2天】Hadoop节点线缆连接检查
|
3天前
| |
Spark安装教程
该教程详细介绍了在Linux环境下安装Spark 3.1.2的步骤。首先,检查JDK版本需为1.8。接着,下载Spark资源并设置环境变量`SPARK_HOME`。配置`spark-env.sh`和`yarn-site.xml`文件,禁用内存检查。然后,重启Hadoop集群,启动Spark集群,并通过`jps -ml`检查Spark Master和Worker。可以通过Web UI访问Spark状态,并使用`spark-shell`测试Scala交互环境及Spark on Yarn。最后,学习如何关闭Spark集群。
|
3天前
| |
常用大数据组件的Web端口号总结
这是关于常用大数据组件Web端口号的总结。通过虚拟机名+端口号可访问各组件服务:Hadoop HDFS的9870,YARN的ResourceManager的8088和JobHistoryServer的19888,Zeppelin的8000,HBase的10610,Hive的10002。ZooKeeper的端口包括客户端连接的2181,服务器间通信的2888以及选举通信的3888。
|
3天前
|
Mahout开源项目
Mahout是一个基于Apache Hadoop的开源机器学习库,旨在为Hadoop生态系统提供分布式机器学习功能。Mahout项目是由ASF(Apache Software Foundation)开发和维护的,它提供了一些可扩展的机器学习算法,包括聚类、分类、推荐和协同过滤等。【2月更文挑战第10天】
|
3天前
|
Spark在深度学习中的优缺点是什么?
【5月更文挑战第2天】Spark在深度学习中的优缺点是什么?
免费试用