「一份成本、两种引擎」-- Babelfish for RDS PostgreSQL发布

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
简介: 2022年5月16号,阿里云RDS重磅发布Babelfish for RDS PostgreSQL,兼容SQL Server生态版本,本篇文章从以下角度探讨Babelfish的方方面面:- Babelfish是什么- 为什么使用PostgreSQL来实现- Babelfish的架构- 受众与场景- 最佳实践- Babelfish的未来发展# Babelfish是什么基于Bab

2022年5月16号,阿里云RDS重磅发布Babelfish for RDS PostgreSQL,兼容SQL Server生态版本,本篇文章从以下角度探讨Babelfish的方方面面:

  • Babelfish是什么
  • 为什么使用PostgreSQL来实现
  • Babelfish的架构
  • 受众与场景
  • 最佳实践
  • Babelfish的未来发展

Babelfish是什么

基于Babelfish for PostgreSQL的开源项目,阿里云RDS PostgreSQL实例生产时开启Babelfish选项后,使您同时获得Microsoft SQL Server和PostgreSQL两种数据库引擎实时在线数据查询和处理的能力。因此,您无需切换数据库驱动程序或重新编写SQL,只需要在少量代码适配的情况下,将应用程序的数据库从SQL Server迁移至开启了Babelfish的阿里云RDS PostgreSQL实例上来,轻松实现“一份成本,两种引擎”。

为什么是PostgreSQL

一个实例,两个引擎,实时在线,双引擎双活,为什么是PostgreSQL数据库来实现呢?总结来看,有如下理由:

  • 良好的开源发展趋势
  • 逐渐走弱的闭源商业数据库
  • 强大的用户基础

开源数据库良好的发展趋势

PostgreSQL 是全球开源数据库排名第二的产品,有着强大的生态和社区力量,且有着最接近商业数据库的企业级特性,有着非常开放的生态和自由的开源协议。DB-Engines 2022年4月份统计,PostgreSQL 较2021年上升56.04分,总分是615.29;SQL Server 较2021年大幅下降51.46,总分是941.20 。
image.png

闭源商业数据库走弱

与开源数据库发展良好势头相反,闭源的商业数据库或原地踏步或一路走低,下图是商业数据库 VS PostgreSQL DB-Engines Ranking:
image.png
从 DB-Engines Ranking来看, 近10年的走势,PostgreSQL 几乎都是一路向好;而反观商业数据库,要么原地踏步,要么一路走低。根据近10年的 DB-Engines Ranking 数据预估,可能在近两年内,PostgreSQL 将超越 SQL Server,说明 PostgreSQL 本身有着强大的生命力。

强大的用户基础

  • 根据DB-Engine Ranking评测,PostgreSQL获得2017,2018和2020三次年度“DBMS of the Year”,最受开发者欢迎的数据库。
  • Stack Overflow开发者调查统计,2019,2020,2021连续三年最受欢迎和最喜爱的数据库排名第二。

image.pngimage.png
PostgreSQL is the DBMS of the Year 2020:https://db-engines.com/en/blog_post/85
Stackoverflow开发者调查统计:
https://insights.stackoverflow.com/survey/2019#technology-most-loved-dreaded-and-wanted
https://insights.stackoverflow.com/survey/2020#technology-most-loved-dreaded-and-wanted
https://insights.stackoverflow.com/survey/2021#technology-most-loved-dreaded-and-wanted

Babelfish架构

从如下两个方面理解babelfish的架构:

  • Babelfish整体架构
  • Babelfish迁移模式架构

    • Single-DB模式
    • Multi-DB模式

整体架构

Babelfish 通过插件的方式扩展 PostgreSQL 的功能,使得 PostgreSQL 在具备自身所有能力的同时,又具备接受和处理 Microsoft SQL Server 数据库数据查询和处理的能力。
image.png
Babelfish整体架构分为三层,至上而下分为:

  • 应用层
  • RDS PostgreSQL引擎层
  • 云原生基础设施层

应用层

开启了Babelfish选项的RDS PostgreSQL,既可以接收和处理来自SQL Server的应用连接,比如:C/C++类的MSSQL ODBC应用,JAVA类的MSSQL JDBC应用以及微软系使用最为广泛的C# .NET Provider for MSSQL类应用;又可以处理来自PostgreSQL类的应用,比如JAVA类PostgreSQL JDBC类应用。

引擎层

一个 Babelfish for RDS PostgreSQL 实例会监听两个 TCP 端口,一个是接受 SQL Server 协议的端口 (TDS),默认是 1433,另一个是接受来自 PostgreSQL 协议的端口,默认是 5432。如此,可以实现“一份成本、两种引擎”,使得SQL Server与PostgreSQL双引擎在线。
TDS 协议端口接受和处理来自 SQL Serve应用类的请求,并将 SQL Server 的 T-SQL 经过自定义解析器转为 PostgreSQL 可以识别的执行计划,交由PostgreSQL内核执行,然后返回给SQL Server终端用户。

云原生基础设施层

RDS PostgreSQL数据库引擎,构建于阿里云云原生基础设施之上,享受来自云存储、计算、网络等基础技术设施的红利。

迁移模式架构

Babelfish for RDS PostgreSQL 有两种迁移模式可供选择,分别是:single-db 模式和 multi-db 模式。迁移模式影响 SQL Server数据库的 shema 到 PostgreSQL 中 babelfish_db 库的 schema 名字的映射方式关系。

Single-DB Mode

image.png

在 single-db 模式下,只支持用户在 Babelfish 中创建一个用户数据库,Babelfish用户数据库的 schema名称和 PostgreSQL 中 babelfish_db 数据库的 schema 名字相同。例如:在 TDS 端口中创建数据库 DB_A,在 DB_A 下创建 schema_A,则在 PostgreSQL 的 babelfish_db 数据库中看到两个 schema:dbo 和 schema_A,对应到 Babelfish 中 DB_A 数据库的 dbo 和 schema_A。其中dbo为SQL Server默认创建的系统schema。
single-db 模式应用场景:

  • 迁移单个 SQL Server 数据库到 Babelfish for RDS PostgreSQL,迁移之后的 schema 名字和 SQL Server 中被迁移数据库下的 schema 名字保持一致,使得应用服务可以在改动尽可能小的情况下切换到RDS PostgreSQL。
  • 整合多个 SQL Server 数据库到一个 Babelfish 数据库,最终目标是完全迁移到 RDS PostgreSQL。

Multi-DB Mode

image.png

在 multi-db 模式下,Babelfish 中用户数据库的 schema 名字映射到 PostgreSQL 的 babelfish_db 数据库中之后会变成:<数据库名>_<shema名字>。例如:在 TDS 端口中创建数据库 DB_A 和 DB_B,在 DB_A 和 DB_B 下分别创建 schema_A 和 schema_B,则在 PostgreSQL 的 babelfish_db 数据库中看到 DB_A 的 schema 为: DB_A_dbo 和 DB_A_schema_A; DB_B 的 schema 为: DB_B_dbo 和 DB_B_schema_B。
multi-db 模式应用场景:

  • SQL Server SAAS使用场景,按数据库划分多租户,每个库一个租户。
  • SQL Server中有多个用户数据库,需要RDS PostgreSQL需要一一对应。
  • 未来可能有迁移多个用户数据库到 RDS PostgreSQL 的需求。
  • 多个 SQL Server 用户数据库需要一起迁移,最终目标是使用 Babelfish 替代 SQL Server。

用户是谁

如果您也有如下的诉求,那么可以考虑使用Babelfish for RDS PostgreSQL。

  • 期望节省SQL Server的License费用支出,想要迁移到开源数据库PostgreSQL。
  • 政策要求去商业数据库,需要将SQL Server切换为PostgreSQL,但又不希望投入大量时间和精力重写应用程序。
  • 期望使用PostgreSQL强大的开源插件库能力,例如时空引擎PostGIS/Ganos,时序插件TimescaleDB等近100款插件。
  • 期望一份成本享受两种数据库引擎实时在线的数据查询和处理能力。

最佳实践

创建Babelfish for RDS PostgreSQL实例

新购RDS PostgreSQL 13版本时,勾选 启用 Babelfish即可创建出Babelfish for RDS PostgreSQL:
image.png

创建用户

RDS PostgreSQL控制台创建高权限账号,
image.png
然后连接实例的 PostgreSQL 端口,执行命令:call sys.babel_initialize_logins('babelfish_user');即可。

连接Babelfish TDS端口

您可以使用以下任何一款客户端连接工具来连接Babelfish for RDS PostgreSQL的TDS端口。

  • tsql (freetds)
  • sqlcmd (SQL Server Command Line)
  • SSMS (SQL Server Management Studio)
  • Azure Data Studio

简单操作

系统查询

  • 查询版本:SELECT @@version;
  • 查询数据库信息:SELECT * FROM sys.databases;

数据库操作

  • 创建数据库:CREATE DATABASE testdb;
  • 查询数据库:select * from sys.databases where name = 'testdb';
  • 查看当前数据库:SELECT db_name();
  • 切换数据库:USE testdb;
  • 删除数据库:DROP DATABASE testdb;

Schema操作

  • 创建Schema:CREATE SCHEMA sch_demo;
  • 查看Schema:SELECT * FROM sys.schemas AS sch WHERE sch.name = 'sch_demo';
  • 删除Schema:DROP SCHEMA sch_demo;

表操作

  • 新建表
-- go inside new db
use testdb
GO
-- create table with two columns
create table dbo.tb_test(
    id int not null IDENTITY(1,1) primary key, 
    name varchar(50))
GO
  • 检查新建表
select sche.name as schema_name, tb.name as table_name
from sys.tables AS tb
    inner join sys.schemas as sche
    on tb.schema_id = sche.schema_id
where tb.name = 'tb_test';
GO
  • 新增字段
-- add column
alter table dbo.tb_test add col_added bigint null;
GO
  • 修改表字段
-- modify column
alter table dbo.tb_test alter column col_added varchar(50);
GO
  • 删除表字段
-- remove column
alter table dbo.tb_test drop column col_added;
GO

索引操作

  • 创建索引
-- create index
create index ix_tb_test_name on tb_test(name);
GO
  • 重建索引
-- rebuild index
alter index ix_tb_test_name on tb_test rebuild;
GO

不支持直接重建索引,但是可以先drop, 然后再create。
image.png

  • 删除索引
-- drop index
drop index ix_tb_test_name on tb_test;
GO

存储过程

  • 创建
-- create store procedure
USE testdb
GO

CREATE PROC dbo.UP_getDemoData(
    @id int
)
AS
BEGIN
    SET NOCOUNT ON
    SELECT * 
    FROM dbo.tb_test 
    WHERE id = @id
END;
GO
  • 查看存储过程
-- check store procedures
select * 
from sys.procedures
where name = 'up_getdemodata';
  • 执行
-- EXEC store procedure
EXEC dbo.UP_getDemoData @id = 7;
GO
  • 修改
-- alter store procedure
USE testdb
GO

ALTER PROC dbo.UP_getDemoData(
    @id int
)
AS
BEGIN
    SET NOCOUNT ON
    SELECT * 
    FROM dbo.tb_test 
    WHERE id >= @id
END;
GO

修改存储过程还不支持,但是可以通过删除,再创建来work around

  • 删除
-- DROP PROC
USE testdb
GO
DROP PROC dbo.UP_getDemoData
GO

数据操作

  • INSERT
-- init data
INSERT INTO dbo.tb_test(name)
SELECT 'A' UNION ALL
SELECT 'B';
GO
  • SELECT
-- query
select * from dbo.tb_test;
  • UPDATE
-- update
update top(1) dbo.tb_test
SET name = 'A_updated'
;
GO
  • DELETE
-- DELETE only one row
DELETE TOP(1) FROM dbo.tb_test;
GO

-- check data 
select * from dbo.tb_test;

应用程序

Babelfish for RDS PostgreSQL的TDS协议,支持一切SQL Server应用,比如:

  • C#类应用程序
  • JAVA类应用程序
  • Python类应用程序
  • C/C++类应用程序
  • Golang类应用程序

详情应用程序Demo,请参考帮助文档:https://help.aliyun.com/document_detail/428618.html

Babelfish不能做什么

Babelfish 目前还没有完全兼容 Microsoft SQL Server T-SQL,详细的语法限制参见:https://babelfishpg.org/docs/usage/limitations-of-babelfish

Babelfish的未来

众所周知,Microsoft SQL Server是一款简单易用、有着非常多企业级特性、功能强大的商业数据库,兼容SQL Server语法,不断减少Limitations是Babelfish未来的发展方向。

SQL Server企业级特性

  • 方便的跨库访问和JOIN
  • 库、表级备份还原能力
  • 内置异步消息中间件(Service Broker)
  • SQL Server PolyBase内置BigData查询支持
  • Resource Governor资源隔离
  • 内存数据库Hekaton

SQL Server 企业级安全性

  • SSL链路加密
  • 透明数据加密TDE
  • 备份加密
  • Column Level Encryptions
  • Row Level Encryption
  • Data Masking
  • Always Encrypted
  • SQL Audit

SQL Server数据同步技术

  • 实例级别:AlwaysOn可用性组
  • 数据库级别:Database Mirroring,Log Shipping
  • 表级别:Replication
  • 行级别:Replication + Row Level Filter
  • 列级别:Replication + View
相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
2月前
|
NoSQL 关系型数据库 MySQL
微服务架构下的数据库选择:MySQL、PostgreSQL 还是 NoSQL?
在微服务架构中,数据库的选择至关重要。不同类型的数据库适用于不同的需求和场景。在本文章中,我们将深入探讨传统的关系型数据库(如 MySQL 和 PostgreSQL)与现代 NoSQL 数据库的优劣势,并分析在微服务架构下的最佳实践。
|
27天前
|
存储 关系型数据库 MySQL
一个项目用5款数据库?MySQL、PostgreSQL、ClickHouse、MongoDB区别,适用场景
一个项目用5款数据库?MySQL、PostgreSQL、ClickHouse、MongoDB——特点、性能、扩展性、安全性、适用场景比较
|
4天前
|
存储 关系型数据库 MySQL
MySQL vs. PostgreSQL:选择适合你的开源数据库
在众多开源数据库中,MySQL和PostgreSQL无疑是最受欢迎的两个。它们都有着强大的功能、广泛的社区支持和丰富的生态系统。然而,它们在设计理念、性能特点、功能特性等方面存在着显著的差异。本文将从这三个方面对MySQL和PostgreSQL进行比较,以帮助您选择更适合您需求的开源数据库。
19 4
|
1天前
|
关系型数据库 MySQL PostgreSQL
postgresql和mysql中的limit使用方法
postgresql和mysql中的limit使用方法
6 1
|
6天前
|
存储 关系型数据库 MySQL
mysql 引擎概述
MySQL存储引擎是处理不同类型表操作的组件,InnoDB是最常用的默认引擎,支持事务、行级锁定和外键。MySQL采用插件式存储引擎架构,支持多种引擎,如MyISAM、Memory、CSV等,每种引擎适用于不同的应用场景。通过`SHOW ENGINES`命令可查看当前MySQL实例支持的存储引擎及其状态。选择合适的存储引擎需根据具体业务需求和引擎特性来决定。
|
2月前
|
Oracle NoSQL 关系型数据库
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
194 2
|
13天前
|
存储 关系型数据库 MySQL
mysql 8.0 的 建表 和八种 建表引擎实例
mysql 8.0 的 建表 和八种 建表引擎实例
17 0
|
27天前
|
存储 关系型数据库 MySQL
四种数据库对比MySQL、PostgreSQL、ClickHouse、MongoDB——特点、性能、扩展性、安全性、适用场景
四种数据库对比 MySQL、PostgreSQL、ClickHouse、MongoDB——特点、性能、扩展性、安全性、适用场景
|
3月前
|
关系型数据库 MySQL Linux
在Linux中,如何配置数据库服务器(如MySQL或PostgreSQL)?
在Linux中,如何配置数据库服务器(如MySQL或PostgreSQL)?
|
3月前
|
SQL 关系型数据库 MySQL
SQL Server、MySQL、PostgreSQL:主流数据库SQL语法异同比较——深入探讨数据类型、分页查询、表创建与数据插入、函数和索引等关键语法差异,为跨数据库开发提供实用指导
【8月更文挑战第31天】SQL Server、MySQL和PostgreSQL是当今最流行的关系型数据库管理系统,均使用SQL作为查询语言,但在语法和功能实现上存在差异。本文将比较它们在数据类型、分页查询、创建和插入数据以及函数和索引等方面的异同,帮助开发者更好地理解和使用这些数据库。尽管它们共用SQL语言,但每个系统都有独特的语法规则,了解这些差异有助于提升开发效率和项目成功率。
270 0