开发者社区 问答 正文

How to overcome mysterious problems caused by large and multi-tenant hadoop cluster at Rakuten

在Hadhoop summit 2016上,Tomomichi Hirano ,EC Core Technology Department, Rakuten Inc分享了题为《How to overcome mysterious problems caused by large and multi-tenant hadoop cluster at Rakuten》,就Rakuten的Hadoop用例,大数据系统的背景下的服务器配置和管理等方面的内容做了深入的分析。

https://yq.aliyun.com/download/1923?spm=a2c4e.11154804.0.0.240f6a79uhb9Sv

展开
收起
福利达人 2018-07-28 23:05:32 941 分享 版权
阿里云 AI 助理回答

在2016年的Hadoop Summit上,Tomomichi Hirano先生来自Rakuten Inc的EC Core Technology Department分享了题为《如何克服由大规模多租户Hadoop集群引发的神秘问题》的演讲。虽然直接的演讲内容细节未包含在当前知识库中,但我们可以根据已有的参考资料,提炼出与大规模Hadoop集群管理、配置优化及故障解决相关的策略,这些策略间接对应于演讲可能涵盖的主题。

集群网络丢包解决方案:

  • 修改系统参数:编辑/etc/sysctl.conf文件,增加ARP缓存和连接跟踪最大值的配置。
  • 应用更改:执行sudo sysctl -p使设置生效,并在遇到特定错误时加载nf_conntrack模块。

ECS实例因维护重新部署处理方法:

  • 确认节点来源:根据事件详情识别受影响的节点。
  • 扩容新节点:在所属节点组内添加新节点以维持服务连续性。
  • 缩容故障节点:针对不同付费类型的节点采取相应缩容操作,确保数据安全。

EMR集群云盘标签自动添加:

  • 启用关联资源标签:通过标签控制台开启ECS实例资源标签继承功能,实现云盘自动添加EMR集群ID标签。

硬件与软件配置要求:

  • 硬件:推荐BE节点使用16核64GB以上配置,FE至少8核16GB,生产环境建议更高规格。
  • 磁盘:支持HDD和SSD,评估容量时考虑压缩比和利用率。
  • CPU:需支持AVX2指令集,对向量化技术有依赖。
  • 网络:建议采用万兆网卡和交换机。
  • 软件:具体配置参见官方文档,副本数通常设为2至3个,分区、分桶和排序键设计需依据查询模式和数据特性优化。

Jindo DistCp高级用法:

  • 删除源文件:使用-deleteOnSuccess参数在复制成功后自动删除源文件。
  • 安全存储AccessKey:将OSS或S3的访问密钥信息预先配置在Hadoop的core-site.xml中,避免命令行暴露敏感信息。

综上所述,尽管无法提供演讲的具体内容,但上述信息覆盖了大规模Hadoop集群运维中的关键挑战与解决方案,包括性能优化、资源管理、以及数据迁移的安全实践,这些均可能是演讲中探讨的重点。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答