开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

为什么MaxComputer的LEFT JOIN结果和inner join一样只查询有关联上的数据,

为什么MaxComputer的LEFT JOIN结果和inner join一样只查询有关联上的数据,没有保留左表的全部数据呢?

展开
收起
滴滴滴~ 2023-03-29 15:32:08 251 0
2 条回答
写回答
取消 提交回答
  • 在 MaxCompute 中,LEFT JOININNER JOIN 在处理左表数据的方式上确实存在差异。

    INNER JOIN

    INNER JOIN 只返回两张表中都有关联关系的行。这意味着如果左表中的某行在右表中没有匹配的行,则该行不会出现在结果集中。

    LEFT JOIN

    LEFT JOIN 返回左表中的所有行,即使它们在右表中没有匹配的行。对于没有匹配行的左表行,右表中的列值将显示为 NULL

    差异原因

    LEFT JOININNER JOIN 使用不同的算法来执行连接操作。INNER JOIN 使用哈希连接,该算法只关注两张表中具有匹配关联键的行。另一方面,LEFT JOIN 使用嵌套循环连接,该算法遍历左表中的每行,并检查它是否与右表中的任何行匹配。

    示例

    考虑以下两张表:

    表 A

    idname
    1John
    2Mary
    3Bob

    表 B

    idcity
    1New York
    2London

    INNER JOIN 结果

    | id | name | city |
    |---|---|---|
    | 1 | John | New York |
    | 2 | Mary | London |
    

    LEFT JOIN 结果

    | id | name | city |
    |---|---|---|
    | 1 | John | New York |
    | 2 | Mary | London |
    | 3 | Bob | NULL |
    

    如您所见,LEFT JOIN 返回了左表中的所有行,即使 id=3 的行在右表中没有匹配的行。

    结论

    总之,LEFT JOININNER JOIN 在处理左表数据的方式上不同,因为它们使用不同的连接算法。LEFT JOIN 保留左表中的所有行,而 INNER JOIN 只返回两张表中都有关联关系的行。

    2024-02-28 18:09:11
    赞同 展开评论 打赏
  • 那说明你的数据条数是一样的,右表中有没有空字符串类型的情况,你可以着重观察一下这个特征。

    2023-03-30 09:39:36
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载