开发者社区> 问答> 正文

我本人是塑胶模具厂的,最近学习了hadoop , 也建立的环境, 如何建立大数据管理工厂,如何规划

1、需要多少服务器? 2、是不是采用 centos 3、磁盘用 raid 5 还是 10 4、局域网和广域网如何链接

展开
收起
深模 2019-08-18 11:27:45 1584 0
1 条回答
写回答
取消 提交回答
  • 如果是想实际使用的集群的话,一般采用7台服务器就可以:4台datanode(因为数据存储三副本容错)可以同时跑nodemanager+1台resourcemanager/或者jobtracker用来做计算的master+1台namenode用来做存储的master+1台secondarynamenode用来做存储的冷备master。另外找一台比较差的机器作为任务提交机器和admin操作机。 服务器的操作系统可以选择多个发行版,centos可以。 磁盘不需要做raid,因为hadoop本身存储层有三副本容灾,节点上磁盘做raid会浪费。 网络局域网连接就可以。

    2020-03-03 20:53:17
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据AI一体化的解读 立即下载
极氪大数据 Serverless 应用实践 立即下载
大数据&AI实战派 第2期 立即下载