文档备案控制台

开发者社区问答正文

在使用 hadoop中的 DistributedCache 把小份数据分布到各个计算节点时，每个 m

在使用 hadoop中的 DistributedCache 把小份数据分布到各个计算节点时，每个 maptask 执行任务的节点都需要加载该数据到内存，然后需要怎么做才能保证程序成功过运行？

展开

收起

游客ysk6odvtzspxs 2021-12-05 09:29:58 656 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客fdypabnykn7yk

需要按连接关键字建立索引：封装 MovieRate,方便数据的排序和序列化；编写 MapReduce 程序

2021-12-05 09:31:24

赞同展开评论

问答分类：

分布式计算 Hadoop

问答地址：

开发者社区 > 大数据 > 问答

相关问答

旧版ECM架构的Hadoop集群绑定的Gateway集群节点组在EMR管控无法升配

184

1

0

E-MapReduce worker节点/mnt/disk1/log/hadoop-hdfs/...

173

1

0

阿里云E-MapReduceJindo DistCp是否支持将数据从Hadoop同步至aws的s3？

269

2

0

hadoop号线不适合这种小文件的存储，还是将数据提取存储到nosql数据库中比较好？

147

1

0

你好用机器学习PAI的emr上的ds集群读hive可以读取我现有hadoop集群的hive数据吗？

171

1

0

各位大佬们，咨询一个Flink问题，如果没有hadoop集权，flink搭建的是3节点的模式？

334

0

0

各位老师，遇到过：trino 不支持查询使用hadoop catalog 写到iceberg的数据

354

0

0

实时计算 Flink版keytab文件能放到hdfs吗还是要放在每个hadoop节点同一目录？

440

1

0

我设置的Hadoop3.3.3是HA，2个NamNode节点，分别had21nn和had21dn1。

1292

2

0

E-MapReduce worker节点/mnt/disk1/log/hadoop-hdfs/下的l

415

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于credits购买机制

qoderWorkCn什么时候才能接入阿里云-百炼平台的token plan,自家套餐都没接入

程序员群体，大家都在用什么code plan方案？还有用的什么编码智能体？

QoderCN Jetbrains插件存在EDT反模式

你们能不能简化点购买什么的，一会qoder官网，一会进阿里云。想续费，点了一会来回跳。。。。

相关文章

EMR Serverless Spark AI Function 的双维降本实践

大数据面试别只背八股！从零到拿下大厂的大数据系统设计备考路线

AWS EMR 上的 Spark 作业迁到阿里云用什么？AnalyticDB MySQL 湖仓版 Serverless Spark 免运维替代方案

AnalyticDB MySQL 湖仓版 Serverless Spark vs EMR Spark：免运维、弹性与成本全维度对比

Google BigQuery 在阿里云上最接近什么产品？AnalyticDB MySQL Serverless 与 MaxCompute 如何选

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

高效存储和处理多媒体数据

还有其他疑问?