「Go开源」goose:深入学习数据库版本管理工具

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 「Go开源」goose:深入学习数据库版本管理工具

goose是一个用go语言编写的数据库版本管理的命令行工具。其github地址如下:https://github.com/pressly/goose


什么是数据库版本管理?


数据库版本管理,其实就是对数据表结构的演进的管理。比如,我们有一个用户表user,如下:


create table if not exists `user` (
  id int auto_increcement comment '主键',
  name varchar(255) NOT NULL DEFAULT '' COMMENT '用户姓名',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB charset='utf-8' COMMENT='用户表';


过了一段时间,需要在该表中增加一个字段address:


alter table `user` add column address varchar(255) NOT NULL DEFAULT '' COMMENT '用户地址';


又过了一段时间,又需要创建一个用户好友表user_friends:


CREATE TABLE if not exists `user_friends` (
  id int auto_increcement comment '主键',
  user_id int NOT NULL DEFAULT 0 COMMENT '用户ID',
  friend_id int NOT NULL DEFAULT 0 COMMENT '好友用户ID',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB charset='utf-8' COMMENT='用户好友表'


你看,上面这些就是对数据库结构的演进。但在演化的过程中,就有可能造成许多问题。比如在多种环境下(生产、测试、预发布环境)数据结构没保持一致问题。数据库的变更没有统一的文档管理等一些列问题。


接下来我们来看看goose是如何管理数据库的演进的。


goose工具详解


安装


goose是一个使用golang语言编写的命令行工作。我们可以在go代码中引入,也可以通过安装在电脑上直接使用。

安装在$GOPATH/bin目录下:


$ go install github.com/pressly/goose/v3/cmd/goose@latest


在Mac下使用brew安装:


brew install goose


使用


安装完成后,使用goose命令即可对数据库进行管理了。goose命令的使用格式如下:


goose [OPTIONS] DRIVER DBSTRING COMMAND


  • DRIVER:指的是数据库驱动器类型。比如goose工具支持以下数据库:postgres、mysql、sqlite3、mssql、redshift、tidb、clickhouse、vertica。
  • DBSTRING:指的是具体数据库的配置。当指定了数据库类型后,就需要指定特定的数据库配置。比如数据库的地址、用户名、密码以及使用哪个数据库等。如下是当使用mysql数据库时的配置:


user:password@/dbname?parseTime=true


  • COMMAND:goose支持的子命令。指明具体要对数据库做的具体动作。goose工具支持如下子命令:


up                   Migrate the DB to the most recent version available
    up-by-one            Migrate the DB up by 1
    up-to VERSION        Migrate the DB to a specific VERSION
    down                 Roll back the version by 1
    down-to VERSION      Roll back to a specific VERSION
    redo                 Re-run the latest migration
    reset                Roll back all migrations
    status               Dump the migration status for the current DB
    version              Print the current version of the database
    create NAME [sql|go] Creates new migration file with the current timestamp
    fix                  Apply sequential ordering to migrations
    validate             Check migration files without running them


以下是对不同数据库的示例:


goose sqlite3 ./foo.db status
    goose sqlite3 ./foo.db create init sql
    goose sqlite3 ./foo.db create add_some_column sql
    goose sqlite3 ./foo.db create fetch_user_data go
    goose sqlite3 ./foo.db up
    goose postgres "user=postgres password=postgres dbname=postgres sslmode=disable" status
    goose mysql "user:password@/dbname?parseTime=true" status
    goose redshift "postgres://user:password@qwerty.us-east-1.redshift.amazonaws.com:5439/db" status
    goose tidb "user:password@/dbname?parseTime=true" status
    goose mssql "sqlserver://user:password@dbname:1433?database=master" status
    goose clickhouse "tcp://127.0.0.1:9000" status
    goose vertica "vertica://user:password@localhost:5433/dbname?connection_load_balance=1" status


看到上述示例,我们知道了使用的数据库类型、数据库的连接地址以及对数据库要做的具体动作。但这个动作要执行什么呢,是不是还少了具体的数据库的定义语句呢?


其实,在上面的命令中还隐含着一个选项就是dir:指定数据库的DDL文件的目录。默认是在当前目录下读取sql文件。


所以,goose的作用即使将指定目录下的sql文件 按指定的子命令进行执行


goose的工作原理


goose的工作原理实际上就是维护了一个有规则版本号的sql文件。在sql文件中通过标记sql语句是升级还是回退来来告知goose如何执行。goose本质上就是两个子命令:升级操作(goose Up)和回退操作(goose Down)。其他的reset子命令和redo子命令都是对升级和回退操作的组合。


下面是升级和回退操作的流程图:

a7022cc24d73e2b0bbbd08c2a83e46ec.png



image.png


24cc0a63509160a81ffc1b3d5f0350f6.png

image.png


goose子命令详解


通过goose的子命令就可以对sql文件进行管理。下面我们详细介绍下goose的各个子命令的含义以及执行的动作。


create


该命令是创建一个sql的迁移文件。如下:


goose mysql "user:password@/dbname?parseTime=true" create add_some_column sql


运行该命令后,就会在当前目录下生成一个sql文件:20231011222931_add_some_column.sql


create命令后的add_some_column就是文件名,sql就是要生成的文件类型。在生成的文件中我们看到文件名前缀中还有一个日期的前缀,这个是命令自动生成的,用来标识文件的版本。这个版本号在up和down命令的时候会非常有用,稍后详细介绍。


生成了sql文件后,就可以在该文件中添加数据表的定义内容了。首先我们看下该sql文件的格式:


-- +goose Up
-- +goose StatementBegin
SELECT 'up SQL query';
-- +goose StatementEnd
-- +goose Down
-- +goose StatementBegin
SELECT 'down SQL query';
-- +goose StatementEnd


在该文件中,我们看到有两部分内容:


  • 类似 -- +goose Up这样的指令:这个指令告诉goose工具,接下来的内容是要在up子命令下执行的。同理,-- +goose Down指令告诉goose工具,其接下来的内容是在down命令下执行的。
  • sql语句:类型SELECT或CREATE等这样的sql,是要具体执行的内容。


基于上述sql模版文件,我们就可以编写自己的数据库的DDL语言了。示例如下:


-- +goose Up
CREATE TABLE users (
    id int NOT NULL PRIMARY KEY,
    username text,
    name text,
    surname text
);
INSERT INTO users VALUES
(0, 'root', '', ''),
(1, 'vojtechvitek', 'Vojtech', 'Vitek');
-- +goose Down
DROP TABLE users;

up


up子命令是从--dir指定的目录下(默认是当前目录)读取sql文件,然后执行sql文件中的 -- +goose Up下的具体的sql语句。同时,goose还会在数据库中生成一个goose_db_version表,该表里记录了执行过的sql文件。如下:


CREATE TABLE `goose_db_version` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
  `version_id` bigint(20) NOT NULL,
  `is_applied` tinyint(1) NOT NULL,
  `tstamp` timestamp NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  UNIQUE KEY `id` (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;


该表里的version_id字段,就是在sql文件的日期。is_applied字段是指该文件是否已执行。


当重复运行up命令时,首先会检查goose_db_version表中最近成功运行的版本,然后再从dir目录下找到该版本的下一个版本的sql文件并执行。这样就避免了之前运行过的sql文件被重复执行。


b8f6a38c84ca9e374ae804bc2a5dc093.png


image.png


up-to


up-to子命令后面必须要跟一个VERSION参数,即指定具体的sql的版本。该命令会根据指定的版本号,从--dir指定的目录下查找对应的sql文件来执行。VERSION指定的版本就是sql文件名前面的数字部分。


down命令


down子命令是对up子命令的回退操作。即从--dir指定的目录中读取sql文件,然后读取sql文件中的标识为-- +goose Down指令的内容。


这里需要注意的是,在sql文件中,-- +goose Down的内容必须是和文件中的 -- +goose Up内容配对出现的,即有向前执行的内容,才会有对应的回退的内容。


down-to


down-to子命令后面也必须跟一个VERSION版本号,标识回退到对应的版本。即从--dir指定的目录中读取特定版本的sql文件中的down的部分。


redo


redo子命令是将最近执行的一个版本先回退,再重新执行该版本。即先从goose_db_version表中查找中最近执行过的一个版本的sql文件,然后执行该文件的回退操作,再执行up操作。


例如,我们刚执行过sql文件 00001_create_users_table.sql,其内容:


-- +goose Up
CREATE TABLE users (
    id int NOT NULL PRIMARY KEY,
    username text,
    name text,
    surname text
);
INSERT INTO users VALUES
(0, 'root', '', ''),
(1, 'vojtechvitek', 'Vojtech', 'Vitek');
-- +goose Down
DROP TABLE users;


如果执行redo操作,则是先执行该文件中的goose Down部分,再执行该文件中的 goose Up部分的内容。


reset


reset子命令是重置操作,即将所有sql文件中的goose Down的部分重新执行一遍。


总结


本文介绍了goose工具的工作流程及原理。同时介绍了使用的sql文件模版中的指令。最后还介绍了对应的子命令的作用及如何执行sql文件中的内容的。若想进一步了解,可读读源代码。


特别说明:你的关注,是我写下去的最大动力。点击下方公众号卡片,直接关注。关注送《100个go常见的错误》pdf文档、经典go学习资料

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1天前
|
存储 JSON NoSQL
学习 MongoDB:打开强大的数据库技术大门
MongoDB 是一个基于分布式文件存储的文档数据库,由 C++ 编写,旨在为 Web 应用提供可扩展的高性能数据存储解决方案。它与 MySQL 类似,但使用文档结构而非表结构。核心概念包括:数据库(Database)、集合(Collection)、文档(Document)和字段(Field)。MongoDB 使用 BSON 格式存储数据,支持多种数据类型,如字符串、整数、数组等,并通过二进制编码实现高效存储和传输。BSON 文档结构类似 JSON,但更紧凑,适合网络传输。
26 15
|
1月前
|
存储 SQL Apache
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
Apache Doris 是一个基于 MPP 架构的高性能实时分析数据库,以其极高的速度和易用性著称。它支持高并发点查询和复杂分析场景,适用于报表分析、即席查询、数据仓库和数据湖查询加速等。最新发布的 2.0.2 版本在性能、稳定性和多租户支持方面有显著提升。社区活跃,已广泛应用于电商、广告、用户行为分析等领域。
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
|
29天前
|
数据库连接 Go 数据库
Go语言中的错误注入与防御编程。错误注入通过模拟网络故障、数据库错误等,测试系统稳定性
本文探讨了Go语言中的错误注入与防御编程。错误注入通过模拟网络故障、数据库错误等,测试系统稳定性;防御编程则强调在编码时考虑各种错误情况,确保程序健壮性。文章详细介绍了这两种技术在Go语言中的实现方法及其重要性,旨在提升软件质量和可靠性。
29 1
|
1月前
|
数据采集 监控 Java
go语言编程学习
【11月更文挑战第3天】
41 7
|
1月前
|
SQL 关系型数据库 MySQL
go语言数据库中mysql驱动安装
【11月更文挑战第2天】
51 4
|
1月前
|
SQL 关系型数据库 MySQL
go语言中安装数据库驱动
【11月更文挑战第1天】
51 5
|
1月前
|
SQL 关系型数据库 MySQL
go语言中数据库操作
【10月更文挑战第22天】
44 4
|
1月前
|
关系型数据库 MySQL 数据库连接
go语言中打开数据库连接
【11月更文挑战第1天】
31 2
|
1月前
|
设计模式 测试技术 Go
学习Go语言
【10月更文挑战第25天】学习Go语言
26 4
|
1月前
|
存储 关系型数据库 MySQL
MySQL vs. PostgreSQL:选择适合你的开源数据库
在众多开源数据库中,MySQL和PostgreSQL无疑是最受欢迎的两个。它们都有着强大的功能、广泛的社区支持和丰富的生态系统。然而,它们在设计理念、性能特点、功能特性等方面存在着显著的差异。本文将从这三个方面对MySQL和PostgreSQL进行比较,以帮助您选择更适合您需求的开源数据库。
163 4
下一篇
DataWorks