在PolarDB为什么filterexec的下推只有下推到exchange和join之下呢?

在PolarDB为什么filterexec的下推只有下推到exchange和join之下呢，也可以下推到agg，project,sort,set下面，但是没看到类似的下推规则的实现呢？

展开

收起

三分钟热度的鱼 2023-08-29 10:27:06 78 0

7 条回答

写回答

取消提交回答

小Lee

PolarDB的filter-exec下推规则只能下推到exchange和join之下，这是因为filter-exec下推的目的是为了减少数据的传输量，而在exchange和join之下，数据的传输量比较大，因此可以通过filter-exec下推来减少数据的传输量。
在agg、project、sort、set等操作中，数据的传输量相对较小，因此不需要使用filter-exec下推来减少数据的传输量。如果您需要在agg、project、sort、set等操作中使用filter-exec下推，可以考虑使用其他的技术，例如使用窗口函数或者使用其他的优化技术来减少数据的传输量。

2023-09-19 11:16:50

赞同展开评论打赏
三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，在阿里云PolarDB中，FilterExec的下推规则是基于物理查询计划的。具体来说，对于下推规则，需要考虑以下几个方面：
1. 下推条件的逻辑：只有满足特定类型的谓词条件才能被下推。例如，只有等于、大于、小于等算术运算才支持下推。
2. 下推的目标节点类型：为了避免复杂度，下推通常只会选择到exchange和join节点下，而不会选择到agg、project、sort、set等节点下。这是因为后者往往涉及更加复杂的操作，需要更为精细的优化。
3. 下推顺序的优先级：如果有多个过滤条件需要下推，需要根据优先级进行排序，以确保实现尽可能的优化。
在PolarDB中，下推规则的实现是通过代码实现的，但具体实现细节可能会因为不同版本和不同场景的需求而有所不同，因此需要根据具体实际情况来进行评估和优化。
2023-09-14 16:58:54

赞同展开评论打赏
Skyund

引入 filter 操作可以减少不必要的数据传输，提高查询性能。而对于 agg、project、sort 和 set 操作，由于它们之间没有直接的数据依赖关系

2023-09-07 21:09:06

赞同展开评论打赏
算精通

北京阿里云ACE会长

在 PolarDB 中，filter、project、sort 和 set 操作在大多数情况下是相互独立的，它们之间没有直接的数据依赖关系。因此，在执行这些操作时，PolarDB 通常会尽可能地并行执行，以提高查询性能。但在某些情况下，您可能希望在这些操作之间引入数据依赖关系，从而实现下推（push-down）操作。
实际上，PolarDB 支持将 filter 操作下推到 exchange 和 join 操作之下。这是因为 exchange 和 join 操作涉及到多个数据源之间的数据交互，引入 filter 操作可以减少不必要的数据传输，提高查询性能。而对于 agg、project、sort 和 set 操作，由于它们之间没有直接的数据依赖关系，因此 filter 操作的下推可能不会带来明显的性能优势。但这并不意味着 filter 操作不能下推到这些操作之下。
在某些特定的查询优化场景中，您可能需要实现 filter 操作在这些操作之间的下推。这可以通过自定义 PolarDB 的执行计划，或者使用 PolarDB 的扩展 API 来实现。然而，在大多数情况下，PolarDB 自动生成的执行计划已经是最优的，无需人工干预。因此，如果您在实践中遇到需要下推 filter 操作到 agg、project、sort 或 set 操作之下的场景，

2023-09-06 19:20:18

赞同展开评论打赏
穿过生命散发芬芳

在PolarDB中，filterexec的下推只能下推到exchange和join之下，而不能下推到agg、project、sort和set节点下的原因是PolarDB的执行引擎目前并没有实现相应的下推规则。

PolarDB是一种基于分布式架构的关系型数据库，它的执行引擎采用了MPP（Massively Parallel Processing）的架构。在这种架构下，查询计划会被划分成多个子计划并行执行，每个子计划对应一个节点。这些子计划之间通过exchange节点进行数据的交换和传输。

在PolarDB的执行引擎中，filterexec节点负责执行过滤操作，它可以将过滤条件下推到exchange和join节点下，以减少数据传输和处理的开销。但是，由于agg、project、sort和set节点的特殊性，目前的PolarDB执行引擎并没有实现相应的下推规则，所以无法将过滤条件下推到这些节点下。

如果需要在PolarDB中实现对agg、project、sort和set节点的过滤操作，可以考虑使用其他方式，如在查询中使用子查询或临时表来实现过滤，或者通过应用层的代码来进行过滤和处理。

2023-09-05 19:01:40

赞同 1 展开评论打赏
vohelon

在PolarDB中，"filter"的下推确实只能下推到Exchange和Join算子之下。这是因为PolarDB的设计目标是在保证查询性能的同时，尽量减少网络开销。在分布式数据库中，数据节点(Data Node, DN)负责存储数据，计算节点(Compute Node, CN)负责处理查询。当一个查询涉及多个表时，PolarDB会将这些表分发到不同的计算节点上进行处理。在这个过程中，PolarDB会将过滤条件(即Filter算子)下推到数据节点上，这样可以避免在计算节点之间传输大量不需要的数据，从而降低网络开销。

然而，PolarDB并没有实现将Filter下推到Aggregate(聚合)、Projection(投影)、Sorting(排序)或者Set Operations(集合操作)等算子之下。这是因为在这些算子中，Filter的下推可能会带来一些负面影响。例如，在一个大型表上进行聚合操作时，如果将过滤条件下推到每个数据节点上，可能会导致每个数据节点都需要处理大量的数据，从而增加计算负担。此外，在某些情况下，将过滤条件下推到这些算子之下可能会导致查询性能下降，因为这意味着更多的数据需要在计算节点之间传输。

总的来说，PolarDB的Filter下推主要是为了降低网络开销，提高查询性能。在设计和实现这个功能时，PolarDB的开发者们需要在保证查询性能和降低网络开销之间取得平衡。在这个过程中，他们可能会选择不去实现某些算子的下推，以便更好地满足PolarDB的设计目标。

2023-09-04 18:17:30

赞同展开评论打赏
叶秋学长

全栈JAVA领域创作者

在 PolarDB 中，filterexec 的下推是指将 filter 操作下推到 exchange 或 join 之下，以减少中间结果的产生，提高查询性能。下推到 exchange 和 join 之下的原因是因为 exchange 和 join 是查询中最消耗资源的操作，将 filter 操作下推到这些操作之下，可以减少中间结果的产生，从而提高查询性能。
至于 filterexec 的下推是否可以下推到 agg、project、sort、set 下面，答案是可以的。不过，由于 agg、project、sort、set 操作的特性和作用，将 filter 操作下推到这些操作之下并不能显著提高查询性能，因此在 PolarDB 中并没有实现这样的下推规则。如果您需要使用这样的下推规则，可以考虑使用其他的优化器或者自行实现。

2023-09-04 17:46:56

赞同展开评论打赏