开发者社区> 问答> 正文

如果数据在一个大的RDD中不做分区,怎么样对一个记录用户订阅信息的表周期性的合并、查询?

已解决

如果数据在一个大的RDD中不做分区,怎么样对一个记录用户订阅信息的表周期性的合并、查询?

展开
收起
游客dof4ggxyen75u 2022-11-01 16:49:40 2236 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    如果带分区,就会把该分区用一定的逻辑去处理,Spark知道其为哈希分区,在执行join时会利用这一信息。

    2022-11-01 16:58:10
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
+ 订阅
技术图谱:由专家组参与技术图谱的绘制与编写,知识与实践的结合让开发者们掌握学习路线与逻辑,快速提升技能 电子书:电子书由阿里内外专家打造,供开发者们下载学习,更与课程相结合,使用户更易理解掌握课程内容 训练营:学习训练营 深入浅出,专家授课,带领开发者们快速上云 精品课程:汇集知识碎片,解决技术难题,体系化学习场景,深入浅出,易于理解 技能自测:提供免费测试,摸底自查 体验实验室:学完即练,云资源免费使用
问答排行榜
最热
最新

相关电子书

更多
RowKey与索引设计:技巧与案例分析 立即下载
HBase2.0重新定义小对象实时存取 立即下载
事务、全局索引、透明分布式 立即下载