之前一直没去了解这块,这两天正好工作中碰到,这里简单记录下data directory的相关代码,InnoDB不支持INDEX_DIRECTORY,不在本文的讨论范围内.
以下涉及代码部分基于MySQL5.7.12
创建表
在建表时指定DATA DIRECTORY,如下所示:
mysql> CREATE TABLE t1 (a INT PRIMARY KEY, b INT) ENGINE=INNODB DATA DIRECTORY='/u01/master';
Query OK, 0 rows affected (0.01 sec)
在指定的目录,会先以库名创建一个目录(如果没有的话),然后将ibd文件存放到其中.而在标准数据目录下,则创建了一个isl后缀的文件,以字符串的格式记录了ibd文件的真正位置
至少需要满足如下条件时data directory 才会生效
- sql_mode不应该设置NO_DIR_IN_CREATE, 否则data directory会被忽略掉
- 只有file-per-table开启时的时候才能够使用
- 临时表不可使用
建表选项的合法性判断参考InnoDB函数:create_table_info_t::create_options_are_invalid
A. 创建数据文件fil_ibd_create
- 先创建目标位置的ibd文件
- tablespace flag的`FSP_FLAGS_MASK_DATA_DIR`被设置,并存储到ibd文件的第一个page中
FSP_SPACE_FLAGS
位置 - 在数据目录下创建isl文件:
RemoteDatafile::create_link_file
B. 存储元数据
软链表的data directory信息是存储在InnoDB系统表SYS_DATAFILES中的,而非frm文件.
参考函数dict_replace_tablespace_in_dictionary
读取
首先,在启动数据库时,会扫描数据表空间,看其路径和存储在系统表中的路径是否是一致的,如果不一致,则更新系统表.
如上例,我们手动删除isl文件,同时将ibd转移到数据目录下,重启后可正常使用,其对应的路径在系统表中被自动更新掉了,代码路径如下:
innobase_start_or_create_for_mysql
|--> dict_check_tablespaces_and_store_max_id
|--> dict_check_sys_tables
|--> fil_ibd_open
|--> dict_update_filepath
但如果两个地方的ibd文件都保留了,服务器就无法判断了,会打印一些信息并将这张表设置为无法访问
[ERROR] InnoDB: A tablespace for `test/t1` has been found in multiple places;
[ERROR] InnoDB: Default location: ./test/t1.ibd, Space ID=619, Flags=1057
[ERROR] InnoDB: Remote location: /u01/master/test/t1.ibd, Space ID=619, Flags=1057
[ERROR] InnoDB: Will not open tablespace `test/t1`
[Warning] InnoDB: Ignoring tablespace `test/t1` because it could not be opened.
真正的路径信息依然存储到tablespace的fil_space_t::name中.而在打开表对象时,也会将路径拷贝到表对象的dict_table_t::data_dir_path中:
dict_load_tablespace
|--> dict_get_and_save_data_dir_path
由于5.7支持general tablespace,允许多个表定义到同一个表空间中,因此多个表对象可能指向同一个数据文件.
当你执行类似`show create table`这样的语句时,路径元数据定义会通过函数ha_innobase::update_create_info
传递到上层