大数据计算MaxCompute odps sql 怎么实现递归查询?

展开

收起

真的很搞笑 2023-10-29 19:21:39 922 版权

4 条回答

写回答

取消提交回答

Zzzz
在MaxCompute中，可以使用递归查询来处理复杂的数据关系。递归查询是一种将一个查询结果作为另一个查询的输入的方法，直到满足某个终止条件为止。

以下是使用递归查询的基本步骤：
1. 定义递归查询的基础情况（base case）：这是递归查询结束的条件，当满足这个条件时，递归查询将停止执行。
2. 定义递归查询的递归情况（recursive case）：这是递归查询的主体部分，它将根据基础情况的结果进行计算。
3. 编写SQL语句并使用WITH RECURSIVE子句来实现递归查询。
以下是一个示例，假设我们有一个员工表（employee），每个员工都有一个上级（manager_id）。我们想要找出所有员工的上级，以及他们的上级，以此类推，直到没有上级为止。
```
WITH RECURSIVE employee_hierarchy AS (
    SELECT id, manager_id
    FROM employee
    WHERE manager_id IS NULL -- 基础情况：没有上级的员工
    UNION ALL
    SELECT e.id, e.manager_id
    FROM employee e
    INNER JOIN employee_hierarchy eh ON e.manager_id = eh.id -- 递归情况：查找每个员工的上级
)
SELECT * FROM employee_hierarchy;
```
在这个示例中，我们首先定义了基础情况，即没有上级的员工。然后，我们定义了递归情况，即查找每个员工的上级。最后，我们将这两个部分组合在一起，得到了整个员工层次结构。
2023-10-31 15:44:39

赞同展开评论
sunrr
在MaxCompute ODPS SQL中，不支持直接的递归查询。但是，你可以通过使用CTE（Common Table Expression）或者WITH RECURSIVE语句来实现类似的效果。

以下是一个使用CTE的示例：
```
WITH RECURSIVE tree(id, parent_id) AS (
    SELECT id, parent_id
    FROM table_name
    UNION ALL
    SELECT child.id, child.parent_id
    FROM tree
    JOIN table_name child ON child.parent_id = tree.id
)
SELECT * FROM tree;
```
在这个示例中，我们首先定义了一个名为tree的CTE，它包含了id和parent_id两个字段。然后，我们在CTE的定义中使用了UNION ALL语句来联合所有满足条件的记录，以及它们的子记录的记录。最后，我们从CTE中选择所有的记录。
2023-10-30 14:46:22

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在大数据计算MaxCompute (原名 ODPS) 中，可以通过递归查询 (Recursive Query) 来实现 SQL 中的多层递归。以下是使用递归查询的基本语法：
```
WITH RECURSIVE [recursive_table_name] AS (
    -- 基础查询，返回初始行集
    SELECT ...
    UNION ALL
    -- 迭代查询，通过关联基础查询的结果产生新的行集，并与基础查询进行合并
    SELECT ...
)
SELECT * FROM [recursive_table_name];
```
在这个语法中，首先定义了一个名为 recursive_table_name 的临时表，其中包含了两个部分：基础查询和迭代查询。
基础查询返回了初始行集，这是递归查询的第一步。然后，迭代查询通过关联基础查询的结果产生新的行集，并将其与基础查询进行合并，从而产生了更多的行。
最后，我们从 recursive_table_name 表中选择所有的行并输出结果。
下面是一个具体的例子，假设我们有一个员工表 employees，其中包含了每个员工的名字以及他们的直接上级的名字：
```
+----+-------+
| id | name  |
+----+-------+
| 1  | John  |
| 2  | Mike  |
| 3  | Lucy  |
| 4  | Lily  |
+----+-------+

+----+---------+
| id | manager |
+----+---------+
| 1  | NULL    |
| 2  | 1       |
| 3  | 1       |
| 4  | 3       |
+----+---------+
```
如果我们想要找出所有员工的所有上级，则可以使用如下的递归查询：
```
WITH RECURSIVE employee_hierarchy AS (
    SELECT e.id, e.name, m.manager, 'level 1' as level
    FROM employees e LEFT JOIN employees m ON e.manager = m.id
    WHERE e.manager IS NOT NULL
    UNION ALL
    SELECT h.id, h.name, m.manager, CONCAT('level ', CAST(l.level + 1 AS STRING)) as level
    FROM employee_hierarchy h LEFT JOIN employees m ON h.manager = m.id
    WHERE m.manager IS NOT NULL
)
SELECT * FROM employee_hierarchy;
```
在这个查询中，我们首先选择了所有的员工及其直接上级，并标记为第一级。然后，我们在迭代查询中选择了所有已经找到的员工的上级，并将它们标记为更高一级。这个过程一直持续到没有更多的上级为止。最终，我们从 employee_hierarchy 表中选择所有的行并输出结果：
```
+----+------+---------+--------+
| id | name | manager | level  |
+----+------+---------+--------+
| 2  | Mike | 1       | level 1|
| 3  | Lucy | 1       | level 1|
| 4  | Lily | 3       | level 1|
| 1  | John | NULL    | level 2|
+----+------+---------+--------+
```
注意，在实际的应用场景中，可能需要根据具体的需求调整基础查询和迭代查询的具体内容，以便生成正确的结果。
2023-10-30 10:35:45

赞同展开评论
芯在这

cte,用pyodps调用递归函数吧，此回答整理自钉群“MaxCompute开发者社区2群”

2023-10-29 23:53:04

赞同展开评论

大数据计算MaxCompute odps sql 怎么实现递归查询?

大数据计算 MaxCompute

相关文章

相关解决方案

热门讨论

热门文章