sql跨表查询的三种方案

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
简介: sql跨表查询的三种方案

前言

最近又个朋友问我,如何进行sql的跨库关联查询?
首先呢,我们知道mysql是不支持跨库连接的,但是老话说得好,只要思想不滑坡,思想总比困难多!

PS:问题摆在这里了,还能不解决是怎么的?

经过一番思考我给他提出了三个方案,虽然都不尽善尽美,但各领风骚!

本人连接方案,以postgreSql库为例。

方案一:连接多个库,同步执行查询

具体思路为在代码中分别连接多个库,查到一个库中所需要的数据之后,通过关键字段,同步执行去其他的库中进行查询相关数据,然后进行需要的数据分析或更新!

优点

  • 可以进行实时查询;
  • 可对数据进行按需修改及逻辑范围内的修改返回值;
  • 一般采用此方案,查询数据会分页查询,或查询条件精确,从而量会比较小,对服务器压力小;
  • 服务器静态分析数据,效率高;

    缺点

  • 不适合进行大批数据写入/查询,会造成数据库连接超时或获取的数据流过大导致服务器内存被大量占用;

  • 同步执行策略,查询数据库用时和运行时间成正比;

代码执行

一些简单的代码逻辑,不会有人看不懂吧~~~
postgreSql.js

//链接多个数据库,并暴露
const pg = require('pg');
const sqlConfig = {
   
   
  testOnePgSql: {
   
   
    user: "postgres",
    database: "admindb",
    password: "123",
    host: "192.168.1.111",//数据库ip地址(胡乱写的,写自己的库ip哈)
    port: 5432, // 扩展属性
    max: 20, // 连接池最大连接数
    idleTimeoutMillis: 3000
  },
  //超岛商户
  testTwoPgSql: {
   
   
    //测试数据库
    user: "postgres",
    database: "admindb",
    password: "123",
    host: "192.168.1.112",//数据库ip地址(胡乱写的,写自己的库ip哈)
    port: 5432, // 扩展属性
    max: 20, // 连接池最大连接数
    idleTimeoutMillis: 3000
  },
  //桃娘商户
  testThreePgSql: {
   
   
    //测试数据库
    user: "postgres",
    database: "admindb",
    password: "123",
    host: "192.168.1.113",//数据库ip地址(胡乱写的,写自己的库ip哈)
    port: 5432, // 扩展属性
    max: 20, // 连接池最大连接数
    idleTimeoutMillis: 3000
  },
};
const testOnePgSql = new pg.Pool(sqlConfig.banuPgSql);
const testTwoPgSql = new pg.Pool(sqlConfig.testTwoPgSql);
const testThreePgSql = new pg.Pool(sqlConfig.testThreePgSql);
module.exports = {
   
   
  testOnePgSql,
  testTwoPgSql,
  testThreePgSql
};

封装查询pgsql方法
postgreSqlClass.js

let sqlMap = require('./postgreSql');
module.exports = {
   
   
  /**
   *查询pgsql数据
   * @param sqlSelect 查询语句 string
   * @param tenancy 商户id string
   */
  select(sqlSelect, tenancy) {
   
   
    //按需连接
    let pool = sqlMap[tenancy];
    return new Promise((resolve, reject) => {
   
   
      pool.connect(async function (err, connection) {
   
   
        if (err) {
   
   
          // 结束会话
          connection.release();
          return reject(err);
        }
        let result = await pgQuery(sqlSelect, connection);
        // 结束会话
        connection.release();
        return resolve(result);
      });
    });
  }

};


/**
 * pgsql查询数据
 * @param sqlQuery 查询语句
 * @param connection pgSql连接后的connection
 * @returns {Promise<unknown>}
 */
async function pgQuery(sqlQuery, connection) {
   
   
  return new Promise((resolve, reject) => {
   
   
    connection.query(sqlQuery, (err, rows) => {
   
   
      if (err) return reject(err);
      return resolve(rows.rows || []);
    });
  });
}

现在进行业务模块
test.js


  "use strict";
//引入pg函数
let PGSQL = require("./postgreSqlClass");

exports.getUserList = async () => {
   
   

  let sqlOneSelect = `${
     
     第一个表查询语句}`;
  let userList = await PGSQL.select(sqlSelect, "testOnePgSql");
  //获取对应two表的数据
  //...逻辑

  let sqlTwoSelect = `${
     
     第一个表查询语句}`;
  let userListTwo = await PGSQL.select(sqlTwoSelect, "testTwoPgSql");
  let result = [];
  //组合你想要的数据
  //...逻辑

  return result;
};

方案二:在主数据库增加冗余表,通过定时更新,造成同库联表查询

比如A库为主数据库,B、C为其他的增项库,我们需要将三个库中的user表进行数据联表查询;
具体思路为:

  • 在A库存在user表,此时创建冗余表user_two、user_three表,并字段对应B、C库的user表字段;
  • 通过代码逻辑,进行定时任务,将B、C表,数据更新至A库user_two、user_three表;
  • 在需要数据分析/查询时,仅查询A库即可,但需要将A库的user、user_two、user_three表进行按需取用;

优点

  • 化跨表查询为同表查询,执行逻辑更为简单;
  • 可进行大数据分析和大数据查询;
  • 可以预处理数据,提高分析速率;

缺点

  • 定时更新,不具备及时性;
  • 需要对应表有最后更新时间字段,否则同步数据会比较多;
  • 增加冗余表,会造成主表空间占用率增加;
  • 定时更新,会导致某一时间点有大量数据写入/修改数据,可能会影响数据读取,因此,建议多节点部署(读写、只读);

相似实现场景

  • T+1时间的报表展示;
  • 局域网本地数据库信息上报至线上数据库;

方案三:(极度不建议)dbLink本地连接多个库,在本地进行数据分析

具体思路:

  • dblink就是我们在创建表的时候连接到我们的远程库,然后我们本地新建的表数据就是映射远程的表的数据。
  • 当我们创建一个以FEDERATED为存储引擎的表时,服务器在数据库目录只创建一个表定义文件。文件由表的名字开始,并有一个frm扩展名。无其它文件被创建,因为实际的数据在一个远程数据库上。这不同于为本地表工作的存储引擎的方式。

执行步骤:

  • 1.如我现在本地要连接我的阿里云的sys_user表,所以我需要在本地建一个相同字段的表,我取名叫sys_user_copy,并连接到远程库,建好后,我本地sys_user_copy的表里面的数据是映射远程的表的数据

image.png
image.png

  • 2.所以我关联查询,可以直接关联我本地sys_user_copy表从而查出来。改了本地的数据,远程的表数据也会跟着变

image.png
image.png

    1. 开启FEDERATED引擎,show engines

image.png
如果这里是NO,需要在配置文件[mysqld]中加入一行:federated
image.png

改完重启服务,就变成yes了。

  • 4 建表时加上连接

image.png

CREATE TABLE (......) 
ENGINE =FEDERATED CONNECTION='mysql://username:password@hostname:port/database/tablename'

优点

  • 不需要程序员介入,不需要开发
  • 快速形成结果,如果只想查询一些数据的话

    缺点

  • 本地表结构必须与远程表完全一样

  • 不支持事务
  • 不支持表结构修改
  • 删除本地表,远程表不会删除
  • 远程服务器必须是一个MySQL服务器
  • 并不会在本地写入数据库数据,实质上是一个软连接,查询大量数据会导致本地内存爆满,因为是查询多个数据库的数据到本地内存,然后在内存中进行计算,此时时间复杂度为O(N^2),空间复杂度也为O(N^2);500条数据,对应本地时间复杂度为25W,时间复杂度为25W;

可用于:两库之间数据导入,不涉及计算,即A导入B,不进行查询A\B进行计算写入C;

方案三思想借鉴于以下文章
https://blog.csdn.net/qq_48721706/article/details/124088963

结语

好的算法,也要基于好的执行方案,所以,三个方案按需使用即可!

最后,如果大家有什么其他的好的方案,欢迎与本人探讨~~~

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
7月前
|
SQL Java 应用服务中间件
Java项目防止SQL注入的四种方案
Java项目防止SQL注入的四种方案
121 0
|
3月前
|
存储 SQL 关系型数据库
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
MySQL调优主要分为三个步骤:监控报警、排查慢SQL、MySQL调优。 排查慢SQL:开启慢查询日志 、找出最慢的几条SQL、分析查询计划 。 MySQL调优: 基础优化:缓存优化、硬件优化、参数优化、定期清理垃圾、使用合适的存储引擎、读写分离、分库分表; 表设计优化:数据类型优化、冷热数据分表等。 索引优化:考虑索引失效的11个场景、遵循索引设计原则、连接查询优化、排序优化、深分页查询优化、覆盖索引、索引下推、用普通索引等。 SQL优化。
564 15
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
|
6月前
|
SQL 关系型数据库 MySQL
SQL调优方案
7、不带任何条件的count(*)查询,是绝对要杜绝的,不仅会引起全盘扫描而且没有任何业务意义。 文章知识点与官方知识档案匹配,可进一步学习相关知识 MySQL入门技能树SQL高级技巧CTE和递归查询88019 人正在系统学习中
36 0
|
4月前
|
SQL 设计模式 数据处理
Flink SQL 在快手实践问题之状态兼容的终极方案特点内容如何解决
Flink SQL 在快手实践问题之状态兼容的终极方案特点内容如何解决
24 0
|
7月前
|
SQL
现有用户成就统计需求,每个用户有多个成就,某一个成就会被多人拥有,写出数据表设计方案,用一条sql查出每个成就(B.ach_name)下的男生(sex=0)和女生(sex=1)分别有多少?
现有用户成就统计需求,每个用户有多个成就,某一个成就会被多人拥有,写出数据表设计方案,用一条sql查出每个成就(B.ach_name)下的男生(sex=0)和女生(sex=1)分别有多少?
69 0
|
6月前
|
SQL 存储 关系型数据库
慢查询优化方案-SQL篇【JavaPub版】
慢查询优化方案-SQL篇【JavaPub版】
174 0
|
7月前
|
SQL 自然语言处理 算法
NL2SQL进阶系列(5):论文解读业界前沿方案(DIN-SQL、C3-SQL、DAIL-SQL)、新一代数据集BIRD-SQL解读
NL2SQL进阶系列(5):论文解读业界前沿方案(DIN-SQL、C3-SQL、DAIL-SQL)、新一代数据集BIRD-SQL解读
NL2SQL进阶系列(5):论文解读业界前沿方案(DIN-SQL、C3-SQL、DAIL-SQL)、新一代数据集BIRD-SQL解读
|
7月前
|
SQL 存储 Apache
Paimon 实践 | 基于 Flink SQL 和 Paimon 构建流式湖仓新方案
Paimon 实践 | 基于 Flink SQL 和 Paimon 构建流式湖仓新方案
1897 59
|
7月前
|
SQL 关系型数据库 MySQL
【MySQL技术之旅】(7)总结和盘点优化方案系列之常用SQL的优化
【MySQL技术之旅】(7)总结和盘点优化方案系列之常用SQL的优化
116 1
|
SQL
SQL语句多个表查询,inner join的用法
SQL语句多个表查询,inner join的用法
253 0
下一篇
无影云桌面