假定有n 个节点,每个节点对应1 个处理器,怎么理解并行连接?
关系运算的连接操作检查元组对查看它们是否满足连接条件,如果满足,数据库会把元组对输出到连接结果。并行连接算法把需要检查的元组对划分到不同的处理器上,每一个处理器在本地计算连接结果,所有处理器并行地计算,最后被系统收集产生最终的结果。
拿最常用的自然连接来说,假设要连接的关系是R 和S,并行连接会把关系R 和关系 S 各自划分为 n 个分区,系统会将分区Ri和Si 发送到节点Ni 上,计算该部分的连接结果,所有节点并行计算结果再合并即可得到最终的连接结果。
集中式数据库中的散列连接(Hash Join)、嵌套循环连接(Nested-Loop Join)等连接方法都有对应的并行化方法。
以上内容摘自《云原生数据库原理与实践》,这本书可以在电子工业出版社天猫店购买。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。