开发者社区 问答 正文

在使用 hadoop中的 DistributedCache 把小份数据分布到各个计算节点时,每个 m

在使用 hadoop中的 DistributedCache 把小份数据分布到各个计算节点时,每个 maptask 执行任务的节点都需要加载该数据到内存,然后需要怎么做才能保证程序成功过运行?

展开
收起
游客ysk6odvtzspxs 2021-12-05 09:29:58 608 分享 版权
1 条回答
写回答
取消 提交回答
  • 需要按连接关键字建立索引:封装 MovieRate,方便数据的排序和序列化; 编写 MapReduce 程序

    2021-12-05 09:31:24
    赞同 展开评论