MySQL之多表连接

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 笔记

开发工具:

  • mysql-8.0
  • DataGrip

数据源:chapter12_order_info.csv

orderid,userid,gmv
101,E001,10
102,E002,20
103,E001,30
104,E004,40
105,E003,50
106,E002,60

数据源:chapter12_order.csv

userid,first_time,orders_7,orders_14
E001,2019/1/2,5,11
E002,2019/5/1,7,14
E003,2018/12/31,6,13
E007,2019/2/5,9,12
E008,2019/1/5,10,13
E009,2019/2/20,7,14

数据源:chapter12_user.csv

userid,sex,city_name,level
E001,男,北京,金牌
E002,男,上海,银牌
E003,女,北京,金牌
E004,男,泉州,铜牌
E005,女,厦门,银牌
E006,女,成都,金牌


(1)表的横向连接


(1.1)表连接的方式

在SQL中表的横向连接主要有left join、right join、inner join、outer join四种方式。


(1.1.1)left join

left join是左连接,左连接就是以左边的表为主表,然后将右边的表根据两张表的公共列往左边的表上连接。比如我们将chapter12_user表当作主表,放在左边,然后将chapter12_order表往左连接,两张表的公共列为userid,具体实现代码如下:

select chapter12_user.userid,
       chapter12_user.sex,
       chapter12_user.city_name,
       chapter12_user.level,
       chapter12_order.userid,
       chapter12_order.first_time,
       chapter12_order.orders_7,
       chapter12_order.orders_14
from chapter12_user
    left join chapter12_order
        on chapter12_user.userid = chapter12_order.userid;

在进行表连接时,我们用on来指明两张表中的公共列。运行上面的代码,会得到左表中的全部信息、右表中的部分信息,具体运行结果如下表所示。

4.png(1.1.2)right join

right join是右连接,右连接与左连接相对应。右连接是以右边的表为主表,然后将左边的表根据两张表的公共列往右边的表上连接。比如,我们将chapter12_order表当作主表,放在右边,然后将chapter12_user表往右连接,两张表的公共列为userid,具体实现代码如下:

select chapter12_user.userid,
       chapter12_user.sex,
       chapter12_user.city_name,
       chapter12_user.level,
       chapter12_order.userid,
       chapter12_order.first_time,
       chapter12_order.orders_7,
       chapter12_order.orders_14
from chapter12_user
    right join chapter12_order
        on chapter12_order.userid = chapter12_user.userid;

运行上面代码,具体运行结果如下表所示。

5.png


(1.1.3)inner join

inner join是内连接,内连接是针对两张表取交集的,即获取公共列中都出现的值的信息。比如,我们将chapter12_user表与chapter12_order表进行内连接,两张表的公共列为userid,具体实现代码如下:

select chapter12_user.userid,
       chapter12_user.sex,
       chapter12_user.city_name,
       chapter12_user.level,
       chapter12_order.userid,
       chapter12_order.first_time,
       chapter12_order.orders_7,
       chapter12_order.orders_14
from chapter12_user
    inner join chapter12_order
        on chapter12_order.userid = chapter12_user.userid;

运行上面的代码,具体运行结果如下表所示。

6.png



(1.1.4)outer join

outer join是外连接,外连接与内连接相对应,是针对两张表取并集的,要查询的信息只要在任意一张表中存在,最后就会显示在结果中。但是MySQL暂不支持外连接的方式。我们就可以用左连接和右连接相组合的方式来达到外连接的效果,具体实现代码如下:

-- 我们就可以用左连接和右连接相组合的方式来达到外连接的效果,具体实现代码如下:
select chapter12_user.userid,
       chapter12_user.sex,
       chapter12_user.city_name,
       chapter12_user.level,
       chapter12_order.userid,
       chapter12_order.first_time,
       chapter12_order.orders_7,
       chapter12_order.orders_14
from chapter12_user
    left join chapter12_order
        on chapter12_user.userid = chapter12_order.userid
union 
select chapter12_user.userid,
       chapter12_user.sex,
       chapter12_user.city_name,
       chapter12_user.level,
       chapter12_order.userid,
       chapter12_order.first_time,
       chapter12_order.orders_7,
       chapter12_order.orders_14
from chapter12_user
    right join chapter12_order
        on chapter12_order.userid = chapter12_user.userid;

运行上面的代码,具体运行结果如下表所示。

7.png


把这两个结果进行纵向连接,在纵向连接的时候我们使用的是union,对连接后的结果进行删除重复值处理,这样就获取到了两张表的并集。


(1.2)表连接的类型

表的连接类型,主要有一对一、一对多、多对多三种。


(1.2.1)一对一

一对一是指用于连接两张表的公共列的值在左表和右表中都是没有重复值的。


(1.2.2)一对多

一对多是指用于连接两张表的公共列的值在左表或右表中是有重复值的。

现在如果我们要对chapter12_user表和chapter12_order_info表根据userid列进行连接时,就是一对多连接,因为userid在chapter12_order_info表中会有重复值,比如E001、E002。这个时候程序就会自动把一对多中没有重复值的一列复制成多条记录,具体实现代码如下:

select
    *
from chapter12_user
    right join chapter12_order_info
        on chapter12_order_info.userid = chapter12_user.userid
order by chapter12_user.userid;

运行上面的代码,具体运行结果如下表所示。

8.png

(1.2.3)多对多

多对多相当于多个一对多,就是用于连接两张表的公共列的值在左右表中都有重复。这个时候就是传说中的笛卡儿积(Cartesian product)。


笛卡儿乘积是指在数学中,两个集合X和Y的笛卡儿积,又称为直积,表示为X × Y,第一个对象是X的成员,而第二个对象是Y的所有可能有序对的其中一个成员。


如果用于连接两张表的一个公共列的值在左表中重复出现了m次,在右表中重复出现了n次,最后连接下来的结果会是m×n条记录。


我们在实际工作中要尽量避免一对多及多对多情况的出现,在对两张表进行连接时,一定要先检查用于连接表的公共列是否有重复值,如果有,则先处理完重复值以后再去与别的表进行连接。


(1.3)多张表连接

有时候,我们需要的信息不止分布在两张表中,这个时候就需要对大于两张的表进行连接,此处以chapter12_order_info表、chapter12_order表、chapter12_user表为例进行三表连接。具体实现代码如下:

-- 多张表的连接
select chapter12_order_info.orderid,
       chapter12_order_info.userid,
       chapter12_order_info.gmv,
       chapter12_user.level,
       chapter12_order.first_time
from chapter12_order_info
    left join chapter12_user
        on chapter12_order_info.userid = chapter12_user.userid
    left join chapter12_order
        on chapter12_order_info.userid = chapter12_order.userid;

运行上面的代码,最后就会得到三张表中不同的信息,具体运行结果如下表所示。

10.png


(2)表的纵向连接


在SQL中进行纵向连接时,我们使用的是union和union all,两者的区别是,前者会对纵向连接后的结果进行删除重复值处理,而后者是不进行任何处理的,只是把两张表连接在一起。如果表中没有重复值,建议使用union all,这样程序就不会执行删除重复值这个过程,可以提高程序的运行效率。


(3)横向连接的底层原理


join主要有Nested Loop、Hash Join、Merge Join三种方式。


Nested Loop又有三种细分的连接方式,分别是Simple Nested-Loop Join、Index Nested-Loop Join、Block Nested-Loop Join。


在介绍原理之前,先介绍两个概念:驱动表(也称为外表)和被驱动表(也称为非驱动表、匹配表或内表)。简单理解一下,驱动表就是主表,left join中的左表是驱动表,right join中的右表是驱动表,一张是驱动表,那么另一张就只能是非驱动表了,在join的过程中,其实就是从驱动表中依次(注意理解这里面的依次)取出每一个值。


(3.1)Simple Nested-Loop Join(简单的嵌套循环联接)

Simple Nested-Loop Join是最简单、最好理解,也是最符合认知的一种连接方式,现在有table A和table B两张表,我们对两张表进行左连接,如果用Simple Nested-Loop Join连接方式去实现,通过下面这张图来理解。

11.png

首先从驱动表table A中依次取出每个值,然后在非驱动表table B中从上往下依次匹配,接着把匹配到的值进行返回,最后把所有返回的值进行合并,这样我们就查找到了table A left join table B的结果。利用这种方式,如果table A表有10行,table B表有10行,则总共需要执行10×10 = 100次查询。


这种“暴力”匹配的方式在数据库中一般不使用。


(3.2)Index Nested-Loop Join(索引嵌套循环联接)

在Index Nested-Loop Join方式中,这里的Index表示要求非驱动表上要有索引,有了索引以后可以减少匹配的次数,匹配次数减少了就可以提高查询的效率了。

12.png

上图中左边是普通列的存储方式,右边是树结构索引,什么是树结构呢?就是数据分布像树一样一层一层的,树结构有一个特点就是左边的数小于顶点的数,右边的数大于顶点的数,如上图中的右图,左边的数3小于顶点的数6,右边的数7大于顶点的数6;左边的数1小于顶点的数3,右边的数4大于顶点的数3。


假如我们现在要匹配值9,如果使用左边这种数据存储方式,系统需要从第一行依次匹配到最后一行才能找到值9,总共需要匹配7次;但是如果我们使用右边这种树结构索引,先拿9和顶点6去匹配,发现9比6大,然后就去顶点的右边找,再去和7匹配,发现9仍然比7大,再去7的右边找,就找到了9,这样只匹配了3次就把我们想要的9找到了。相比匹配7次节省了很多时间。

13.png

数据库中的索引一般用B+树,为了让读者更好地理解,上图只是最简单的一种树结构,而非真实的B+树。


如果索引是主键,则效率会更高,因为主键必须是唯一的,所以如果非驱动表是用主键连接的,则只会出现多对一或者一对一的情况,而不会出现多对多和一对多的情况。


(3.3)Block Nested-Loop Join(块嵌套循环联接)

在理想情况下,用索引匹配是最高效的一种方式,但是在现实工作中,并不是所有的列都是索引列,这个时候就需要用到Block Nested-Loop Join方式了,这种方式与Simple Nested-Loop Join方式比较类似,唯一的区别就是它会把驱动表中left join涉及的列(不只是用来on的列,还有select部分的列)先取出来放到一个缓存区域,然后去和非驱动表进行匹配,这种方式和Simple Nested-Loop Join方式相比所需要的匹配次数是一样的,差别就在于驱动表的列数不同,也就是数据量的多少不同。所以虽然匹配次数没有减少,但是总体的查询性能还是有所提升的。


Simple Nested-Loop Join方式的连接原理如下图所示,驱动表会拿表中全部列去和非驱动表进行匹配连接。


14.png

Block Nested-Loop Join方式的连接原理如下图所示,驱动表会把select中用到的列和on中用到的列拿出来去和非驱动表进行匹配连接。

15.png







相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
12天前
|
安全 关系型数据库 MySQL
【赵渝强老师】MySQL的连接方式
本文介绍了MySQL数据库服务器启动后的三种连接方式:本地连接、远程连接和安全连接。详细步骤包括使用root用户登录、修改密码、创建新用户、授权及配置SSL等。并附有视频讲解,帮助读者更好地理解和操作。
|
26天前
|
SQL Java 关系型数据库
java连接mysql查询数据(基础版,无框架)
【10月更文挑战第12天】该示例展示了如何使用Java通过JDBC连接MySQL数据库并查询数据。首先在项目中引入`mysql-connector-java`依赖,然后通过`JdbcUtil`类中的`main`方法实现数据库连接、执行SQL查询及结果处理,最后关闭相关资源。
|
30天前
|
SQL JavaScript 关系型数据库
node博客小项目:接口开发、连接mysql数据库
【10月更文挑战第14天】node博客小项目:接口开发、连接mysql数据库
|
1月前
|
Java 关系型数据库 MySQL
【编程基础知识】Eclipse连接MySQL 8.0时的JDK版本和驱动问题全解析
本文详细解析了在使用Eclipse连接MySQL 8.0时常见的JDK版本不兼容、驱动类错误和时区设置问题,并提供了清晰的解决方案。通过正确配置JDK版本、选择合适的驱动类和设置时区,确保Java应用能够顺利连接MySQL 8.0。
153 1
|
1月前
|
Java 关系型数据库 MySQL
springboot学习五:springboot整合Mybatis 连接 mysql数据库
这篇文章是关于如何使用Spring Boot整合MyBatis来连接MySQL数据库,并进行基本的增删改查操作的教程。
81 0
springboot学习五:springboot整合Mybatis 连接 mysql数据库
|
1月前
|
SQL JavaScript 关系型数据库
Node.js 连接 MySQL
10月更文挑战第9天
20 0
|
2月前
|
SQL 关系型数据库 MySQL
MySQL C连接与使用
【9月更文挑战第21天】在 MySQL 中,可以通过 C 语言连接和操作数据库。首先需安装 MySQL 服务器及 C 开发库,然后在程序中包含必要头文件,初始化连接对象,并使用实际参数建立连接。执行 SQL 语句时,需替换表名等变量,获取并遍历结果集。最后,释放资源并关闭连接。过程中应注意错误处理、内存管理和安全性,以及性能优化。此方式适用于高效数据存储和检索的应用程序。
|
2月前
|
SQL JavaScript 关系型数据库
Node服务连接Mysql数据库
本文介绍了如何在Node服务中连接MySQL数据库,并实现心跳包连接机制。
43 0
Node服务连接Mysql数据库
|
1月前
|
关系型数据库 MySQL Linux
Navicat 连接 Windows、Linux系统下的MySQL 各种错误,修改密码。
使用Navicat连接Windows和Linux系统下的MySQL时可能遇到的四种错误及其解决方法,包括错误代码2003、1045和2013,以及如何修改MySQL密码。
213 0
|
3月前
|
关系型数据库 MySQL 网络安全
有关使用Navicat 无法成功连接腾讯云服务器上Mysql的问题解决
这篇文章提供了解决Navicat无法连接腾讯云服务器上MySQL问题的步骤,包括调整防火墙设置、更新MySQL权限和检查远程连接配置。
有关使用Navicat 无法成功连接腾讯云服务器上Mysql的问题解决
下一篇
无影云桌面