【Databend】多表联结,你不会还没有掌握吧!

简介: 【Databend】多表联结,你不会还没有掌握吧!

概述和数据准备

多表联结是两个或多个表的列合并到一个结果集中。Databend 中支持的连接类型有 inner join 、cross join 、natural join 、left join 、right join 、left anti join 、right anti join 、full outer join。


在这里我们只讲最常见的几种,其中 inner join 、left join 、right join 最常用。

数据准备:

drop table if exists vip_info;
create table if not exists vip_info (
    client_id int,
    region varchar
);
drop table if exists purchase_records;
create table if not exists purchase_records (
    client_id int,
    item varchar,
    qty int
);
drop table if exists gift;
create table if not exists gift (
    gift varchar
);

insert into vip_info values
    (101, 'Toronto'),
    (102, 'Quebec'),
    (103, 'Vancouver');

insert into purchase_records values
    (100, 'Croissant', 2000),
    (102, 'Donut', 3000),
    (103, 'Coffee', 6000),
    (106, 'Soda', 4000);

insert into gift values
    ('Croissant'),
    ('Donut'),
    ('Coffee'),
    ('Soda');  

内连接

内连接使用 inner join 语法,其中 inner 可以省略,返回满足结果集中连接条件的行。当列相同时,可以将 on 转化成 using 来简化语法。

需求:根据准备的数据,返回VIP客户的购买记录。

select t2.client_id
     , t2.item
     , t2.qty
from vip_info as t1
         join purchase_records as t2
              using (client_id);

交叉连接

交叉连接使用 cross join 语法,也可以使用 inner join 不加连接条件实现,返回一个结果集,该结果集包括第一个表中的每一行,与第二个表中的每一行连接。

需求:将每个礼品选项分配给每个VIP客户。

-- 方法一:使用 cross join
select t1.*,t2.*
from vip_info as t1
         cross join gift as t2;
-- 方法二:使用 inner join 但是没有加匹配条件
select t1.*,t2.*
from vip_info as t1
         join gift as t2;

左连接

左连接使用 left join 语法,返回左表中的所有记录,以及右表中的匹配记录。如果没有匹配,结果是右侧的 NULL 记录。

需求:返回所有VIP客户的购买记录,如果VIP客户没有购买,购买记录将为 NULL。

select t1.*,t2.*
from vip_info as t1
        left join purchase_records as t2
              using (client_id); 

右连接

左连接使用 right join 语法,返回右表中的所有记录,以及左表中匹配的记录。如果没有匹配,结果是左侧的 NULL 记录。

需求:返回所有客户的购买记录,如果不是VIP客户,VIP客户信息将为 NULL。

select t1.*,t2.*
from vip_info as t1
        right join purchase_records as t2
              on t1.client_id = t2.client_id;  

左反和右反连接

左侧反连接使用 left anti join 语法,从左侧表中返回右侧表中没有匹配行的行。这是 Databend 的语法,建议使用 left join 配合 where 实现。

-- 方法一:使用 left anti join 实现,只能返回 t1 表的信息
select *
from vip_info as t1
        left anti join purchase_records as t2
              on t1.client_id = t2.client_id;   
-- 方法二:使用 left join 配合 where 实现
select t1.*, t2.*
from vip_info as t1
         left join purchase_records as t2
                   on t1.client_id = t2.client_id
where t2.client_id is null;    
+-----------+---------+-----------+------+-----+
| client_id |  region | client_id | item | qty |
+-----------+---------+-----------+------+-----+
|     101   | Toronto |    NULL   | NULL | NULL|
+-----------+---------+-----------+------+-----+ 

右反连接使用 right anti join 语法,从右表返回左表中没有匹配行的行。这是 Databend 的语法,建议使用 left join 配合 where 实现。

-- 方法一:使用 left anti join 实现,只能返回 t1 表的信息
select *
from vip_info as t1
        right anti join purchase_records as t2
              on t1.client_id = t2.client_id;   
-- 方法二:使用 left join 配合 where 实现
select t1.*, t2.*
from vip_info as t1
         right join purchase_records as t2
                   on t1.client_id = t2.client_id
where t1.client_id is null;    
+-----------+---------+-----------+-----------+-----+
| client_id |  region | client_id |    item   | qty |
+-----------+---------+-----------+-----------+-----+
|    NULL   |   NULL  |    100    | Croissant | 2000|
+-----------+---------+-----------+-----------+-----+ 
|    NULL   |   NULL  |    106    |    Soda   | 4000|
+-----------+---------+-----------+-----------+-----+

全连接

全连接使用 full outer join 返回两个表中的所有行,在可以匹配的地方匹配行,并在不存在匹配行的地方放置NULL。

-- 方法一:使用 full outer join 语法
select t1.*, t2.*
from vip_info as t1
         full outer join purchase_records as t2
                   on t1.client_id = t2.client_id;
-- 方法二:使用 left join、right join 和 union 实现
select t1.*, t2.*
from vip_info as t1
         left join purchase_records as t2
                   on t1.client_id = t2.client_id
union
select t1.*, t2.*
from vip_info as t1
         right join purchase_records as t2
                    on t1.client_id = t2.client_id;

总结

多表联结语法很简单,不同数据库可能语法不一样,但只要掌握 inner join、left join 、right join 三种语法,配合 where 或者 union 基本上可以解决所有相关的多表连接问题,赶紧实践动起来。

参考资料:

Databend JOIN :https://docs.databend.com/guides/query/join

Mysql 多表数据横向合并和纵向合并:https://blog.csdn.net/weixin_50357986/article/details/134866388

相关文章
|
分布式计算 资源调度 Hadoop
HBase表数据的读、写操作与综合操作
HBase表数据的读、写操作与综合操作
356 0
|
监控 算法 Java
Linux下如何查看高CPU占用率线程 LINUX CPU利用率计算
目录(?)[-] proc文件系统 proccpuinfo文件 procstat文件 procpidstat文件                                           procpidtasktidstat文件 系统中有关进程cpu使用率的常用命令 ...
10333 40
|
9月前
|
数据采集 监控 调度
干货分享“用 多线程 爬取数据”:单线程 + 协程的效率反超 3 倍,这才是 Python 异步的正确打开方式
在 Python 爬虫中,多线程因 GIL 和切换开销效率低下,而协程通过用户态调度实现高并发,大幅提升爬取效率。本文详解协程原理、实战对比多线程性能,并提供最佳实践,助你掌握异步爬虫核心技术。
|
存储 SQL JSON
Databend 的安装配置和使用
Databend 的安装配置和使用
644 1
|
自然语言处理 数据可视化 数据挖掘
评测:大模型时代的智能BI—Quick BI
作为一位产品经理,我近期体验了阿里云Quick BI的深度功能。其智能小Q助手通过自然语言生成可视化报表,大幅提升非技术人员操作效率;本地文件数据源功能实现快速数据分析,减少对IT依赖。智能问数和移动端适配表现出色,但字段命名规则校验及权限控制需优化。总体而言,Quick BI适合中大型企业业务分析,生态兼容性强,智能化覆盖全流程,值得推荐(评分:4.5/5)。
|
安全 网络安全 虚拟化
Hyper-V网络连接无响应解决方案
当Hyper-V虚拟机出现网络连接无响应时,可从以下方面排查:1) 检查物理网络连接,确保设备正常;2) 验证虚拟网络配置,包括虚拟交换机和网络适配器设置;3) 更新驱动程序以解决兼容性问题;4) 调整防火墙和安全软件设置;5) 重启相关服务和设备;6) 使用命令行工具诊断网络问题;7) 检查BIOS中虚拟化技术是否启用;8) 排查IP冲突和其他日志错误。综合以上步骤,可有效修复网络连接故障。
|
人工智能 分布式计算 Cloud Native
云原生数据仓库AnalyticDB:深度智能化的数据分析洞察
云原生数据仓库AnalyticDB(ADB)是一款深度智能化的数据分析工具,支持大规模数据处理与实时分析。其架构演进包括存算分离、弹性伸缩及性能优化,提供zero-ETL和APS等数据融合功能。ADB通过多层隔离保障负载安全,托管Spark性能提升7倍,并引入AI预测能力。案例中,易点天下借助ADB优化广告营销业务,实现了30%的任务耗时降低和20%的成本节省,展示了云原生数据库对出海企业的数字化赋能。
641 3
|
网络安全 Windows
Windows server 2012R2系统安装远程桌面服务后无法多用户同时登录是什么原因?
【11月更文挑战第15天】本文介绍了在Windows Server 2012 R2中遇到的多用户无法同时登录远程桌面的问题及其解决方法,包括许可模式限制、组策略配置问题、远程桌面服务配置错误以及网络和防火墙问题四个方面的原因分析及对应的解决方案。
1541 4
|
SQL 关系型数据库 MySQL
"告别蜗牛速度!解锁批量插入数据新姿势,15秒狂插35万条,数据库优化就该这么玩!"
【8月更文挑战第11天】在数据密集型应用中,高效的批量插入是性能优化的关键。传统单条记录插入方式在网络开销、数据库I/O及事务处理上存在明显瓶颈。批量插入则通过减少网络请求次数和数据库I/O操作,显著提升效率。以Python+pymysql为例,通过`executemany`方法,可实现在15秒内将35万条数据快速入库,相较于传统方法,性能提升显著,是处理大规模数据的理想选择。
1616 5