1 MySQL存储引擎和索引介绍
2 数据库设计原则
3 数据库是事务
事务(TRANSACTION)是作为单个逻辑工作单元执行的一系列操作, 这些操作作为一个整体一起向系统 提交,要么都执行、要么都不执行 。 事务是一个不可分割的工作逻辑单元事务必须具备以下四个属 性,简称 ACID 属性:
- 原子性(Atomicity)
事务是一个完整的操作。事务的各步操作是不可分的(原子的);要么都执行,要么都不执 行。 - 一致性(Consistency)
当事务完成时,数据必须处于一致状态。 - 隔离性(Isolation)
对数据进行修改的所有并发事务是彼此隔离的, 这表明事务必须是独立的,它不应以任何方 式依赖于或影响其他事务。 - 永久性(Durability)
事务完成后,它对数据库的修改被永久保持,事务日志能够保持事务的永久性
4 SQL优化
1 查询语句中不要使用select *
2 尽量减少子查询,使用关联查询(left join,right join,inner join)替代
3 减少使用IN或者NOT IN ,使用exists,not exists或者关联查询语句替代
4 or 的查询尽量用 union或者union all 代替(在确认没有重复数据或者不用剔除重复数据时,union all会更好)
5 应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描。
6 应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫 描,如: select id from t where num is null 可以在num上设置默认值0,确保表中num列没有null 值,然后这样查询: select id from t where num=0
5 简单说一说drop、delete与truncate的区别
SQL中的drop、delete、truncate都表示删除,但是三者有一些差别 delete和truncate只删除表的数据不删除表的结构
速度,一般来说: droptruncate >delete
delete语句是dml,这个操作会放到rollback segement中,事务提交之后才生效;
如果有相应的trigger,执行的时候将被触发. truncate,drop是ddl, 操作立即生效,原数据不放到 rollbacksegment中,不能回滚. 操作不触发trigger
9 什么是视图
视图是一种虚拟的表,具有和物理表相同的功能。可以对视图进行增,改,查,操作,试图通常是有一 个表或者多个表的行或列的子集。对视图的修改不影响基本表。它使得我们获取数据更容易,相比多表查询
7 什么是内联接、左外联接、右外联接?
内联接(Inner Join):匹配2张表中相关联的记录。
左外联接(Left Outer Join):除了匹配2张表中相关联的记录外,还会匹配左表中剩余的记录,右表 中未匹配到的字段用NULL表示。
右外联接(Right Outer Join):除了匹配2张表中相关联的记录外,还会匹配右表中剩余的记录,左表 中未匹配到的字段用NULL表示。在判定左表和右表时,要根据表名出现在Outer Join的左右位置关系
8 并发事务带来哪些问题?
在典型的应用程序中,多个事务并发运行,经常会操作相同的数据来完成各自的任务(多个用户对同一 数据进行操作)。并发虽然是必须的,但可能会导致以下的问题。
脏读(Dirty read): 当一个事务正在访问数据并且对数据进行了修改,而这种修改还没有提交到数据 库中,这时另外一个事务也访问了这个数据,然后使用了这个数据。因为这个数据是还没有提交的数 据,那么另外一个事务读到的这个数据是“脏数据”,依据“脏数据”所做的操作可能是不正确的。
丢失修改(Lost to modify): 指在一个事务读取一个数据时,另外一个事务也访问了该数据,那么在 第一个事务中修改了这个数据后,第二个事务也修改了这个数据。这样第一个事务内的修改结果就被丢 失,因此称为丢失修。 例如:事务1读取某表中的数据A=20,事务2也读取A=20,事务1修改A=A-1, 事务2也修改A=A-1,最终结果A=19,事务1的修改被丢失。
不可重复读(Unrepeatableread): 指在一个事务内多次读同一数据。在这个事务还没有结束时,另 一个事务也访问该数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改导致第一个 事务两次读取的数据可能不太一样。这就发生了在一个事务内两次读到的数据是不一样的情况,因此称 为不可重复读。
幻读(Phantom read): 幻读与不可重复读类似。它发生在一个事务(T1)读取了几行数据,接着另 一个并发事务(T2)插入了一些数据时。在随后的查询中,第一个事务(T1)就会发现多了一些原本不 存在的记录,就好像发生了幻觉一样,所以称为幻读。
不可重复读和幻读区别:
不可重复读的重点是修改比如多次读取一条记录发现其中某些列的值被修改,幻读的重点在于新增或者 删除比如多次读取一条记录发现记录增多或减少了
9 事务隔离级别有哪些?MySQL的默认隔离级别是?
SQL 标准定义了四个隔离级别:
READ-UNCOMMITTED(读取未提交): 最低的隔离级别,允许读取尚未提交的数据变更,可能会导致 脏读、幻读或不可重复读。
**READ-COMMITTED(读取已提交):**允许读取并发事务已经提交的数据,可以阻止脏读,但是幻读或不 可重复读仍有可能发生。
REPEATABLE-READ(可重复读): 对同一字段的多次读取结果都是一致的,除非数据是被本身事务自己 所修改,可以阻止脏读和不可重复读,但幻读仍有可能发生
SERIALIZABLE(可串行化): 最高的隔离级别,完全服从ACID的隔离级别。所有的事务依次逐个执行, 这样事务之间就完全不可能产生干扰,也就是说,该级别可以防止脏读、不可重复读以及幻读
MySQL InnoDB 存储引擎的默认支持的隔离级别是 REPEATABLE-READ(可重读)。我们可以通过 SELECT @@tx_isolation; 命令来查看
mysqlSELECT @@tx_isolation; ±----------------+
| @@tx_isolation |
±----------------+
| REPEATABLE-READ |
±----------------+
这里需要注意的是:与 SQL 标准不同的地方在于 InnoDB 存储引擎在 REPEATABLE-READ(可重读)事 务隔离级别下使用的是Next-Key Lock 锁算法,因此可以避免幻读的产生,这与其他数据库系统(如SQL Server) 是不同的。所以说InnoDB 存储引擎的默认支持的隔离级别是 REPEATABLE-READ(可重读) 已经可以完全保证事务的隔离性要求,即达到了 SQL标准的 SERIALIZABLE(可串行化) 隔离级别。因为 隔离级别越低,事务请求的锁越少,所以大部分数据库系统的隔离级别都是 READCOMMITTED(读取提 交内容) ,但是你要知道的是InnoDB 存储引擎默认使用 REPEAaTABLEREAD(可重读) 并不会有任何 性能损失
InnoDB 存储引擎在 分布式事务 的情况下一般会用到 SERIALIZABLE(可串行化) 隔离级别。
10 分表分库相关
11 数据库并发策略
并发控制一般采用三种方法,分别是乐观锁和悲观锁以及时间戳。
12 MySQL 中有哪几种锁?
1 表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。
2 行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高。
3 页面锁:开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定粒度界于表锁和行锁之间,并发 度一般
13 MySQL 中 InnoDB 支持的四种事务隔离级别名称,以及逐级之 间的区别?
SQL 标准定义的四个隔离级别为:
1 read uncommited :读到未提交数据
2 read committed:脏读,不可重复读
3 repeatable read:可重读
4 serializable :串行事物
14 CHAR 和 VARCHAR 的区别?
1 CHAR 和 VARCHAR 类型在存储和检索方面有所不同
2 CHAR 列长度固定为创建表时声明的长度,长度值范围是 1 到 255 当 CHAR值被存储时,它们被用 空格填充到特定长度,检索 CHAR 值时需删除尾随空格。
15 主键和候选键有什么区别?
表格的每一行都由主键唯一标识,一个表只有一个主键。
主键也是候选键。按照惯例,候选键可以被指定为主键,并且可以用于任何外键 引用。
16 myisamchk 是用来做什么的?
它用来压缩 MyISAM 表,这减少了磁盘或内存使用。
17 MyISAM Static 和 MyISAM Dynamic 有什么区别?
在 MyISAM Static 上的所有字段有固定宽度。动态 MyISAM 表将具有像 TEXT,BLOB 等字段,以适应 不同长度的数据类型。
MyISAM Static 在受损情况下更容易恢复。
18 如果一个表有一列定义为 TIMESTAMP,将发生什么?
每当行被更改时,时间戳字段将获取当前时间戳。
列设置为 AUTO INCREMENT 时,如果在表中达到最大值,会发生什么情况?
它会停止递增,任何进一步的插入都将产生错误,因为密钥已被使用。
怎样才能找出最后一次插入时分配了哪个自动增量?
LAST_INSERT_ID 将返回由 Auto_increment 分配的最后一个值,并且不需要指定表名称
19 你怎么看到为表格定义的所有索引?
索引是通过以下方式为表格定义的:
SHOW INDEX FROM ;
20 LIKE 声明中的%和_是什么意思?
%对应于 0 个或更多字符,_只是 LIKE 语句中的一个字符
如何在 Unix 和 MySQL 时间戳之间进行转换?
UNIX_TIMESTAMP 是从 MySQL 时间戳转换为 Unix 时间戳的命令
FROM_UNIXTIME 是从 Unix 时间戳转换为 MySQL 时间戳的命令
21 列对比运算符是什么?
在 SELECT 语句的列比较中使用=,<>,<=,<,=,>,<<,>>,<=>,AND,OR 或 LIKE 运算符。
22 BLOB 和 TEXT 有什么区别?
BLOB 是一个二进制对象,可以容纳可变数量的数据。TEXT 是一个不区分大小写
的 BLOB。
BLOB 和 TEXT 类型之间的唯一区别在于对 BLOB 值进行排序和比较时区分大小 写,对 TEXT 值不区分大小写。
23 MySQL_fetch_array 和 MySQL_fetch_object 的区别是什 么?
以下是 MySQL_fetch_array 和 MySQL_fetch_object 的区别: MySQL_fetch_array() – 将结果行作为关联数组或来自数据库的常规数组返回。 MySQL_fetch_object – 从数据库返回结果行作为对象。
24 MyISAM 表格将在哪里存储,并且还提供其存储格式?
每个 MyISAM 表格以三种格式存储在磁盘上:
·“.frm”文件存储表定义·数据文件具有“.MYD”(MYData)扩展名 索引文件具有“.MYI”(MYIndex)扩展名
25 MySQL 如何优化 DISTINCT?
DISTINCT 在所有列上转换为 GROUP BY,并与 ORDER BY 子句结合使用。 SELECT DISTINCT t1.a FROM t1,t2 where t1.a=t2.a;
26 如何显示前 50 行?
在 MySQL 中,使用以下代码查询显示前 50 行:
SELECT*FROM LIMIT 0,50;
27 可以使用多少列创建索引?
任何标准表最多可以创建 16 个索引列 。
28 NOW()和 CURRENT_DATE()有什么区别?
NOW()命令用于显示当前年份,月份,日期,小时,分钟和秒。
CURRENT_DATE()仅显示当前年份,月份和日期。
29 什么是非标准字符串类型?
1 TINYTEXT
2 TEXT
3 MEDIUMTEXT
4 LONGTEXT
30 什么是通用 SQL 函数?
1 CONCAT(A, B) – 连接两个字符串值以创建单个字符串输出。通常用于将两个或多个字段合并为一个 字段。
2 FORMAT(X, D)- 格式化数字 X 到 D 有效数字。
3 CURRDATE(), CURRTIME()- 返回当前日期或时间。
4 NOW() – 将当前日期和时间作为一个值返回。
5 MONTH(),DAY(),YEAR(),WEEK(),WEEKDAY() – 从日期值中提取给定数据。
6 HOUR(),MINUTE(),SECOND() – 从时间值中提取给定数据。
7 DATEDIFF(A,B) – 确定两个日期之间的差异,通常用于计算年龄
8 SUBTIMES(A,B) – 确定两次之间的差异。
9 FROMDAYS(INT) – 将整数天数转换为日期值
31 MySQL 支持事务吗?
在缺省模式下,MySQL 是 autocommit 模式的,所有的数据库更新操作都会即时提交,所以在缺省情 况下,MySQL 是不支持事务的。
但是如果你的 MySQL 表类型是使用 InnoDB Tables 或 BDB tables 的话,你的MySQL 就可以使用事务 处理,使用 SET AUTOCOMMIT=0 就可以使 MySQL 允许在非 autocommit 模式,在非autocommit 模 式下,你必须使用 COMMIT 来提交你的更改,或者用 ROLLBACK来回滚你的更改。
32 MySQL 里记录货币用什么字段类型好
NUMERIC 和 DECIMAL 类型被 MySQL 实现为同样的类型,这在 SQL92 标准允许。他们被用于保存值,该值的准确精度是极其重要的值,例如与金钱有关的数据。当声明一个类是这些类型之一时,精度 和规模的能被(并且通常是)指定。
例如:
在这个例子中,9(precision)代表将被用于存储值的总的小数位数,而 2(scale)代表将被用于存储小数点 后的位数。因此,在这种情况下,能被存储在 salary 列中的值的范围是从-9999999.99 到 9999999.99。
salary DECIMAL(9,2)
在这个例子中,9(precision)代表将被用于存储值的总的小数位数,而 2(scale)代表将被用于存储小数点 后的位数。因此,在这种情况下,能被存储在 salary 列中的值的范围是从-9999999.99 到 9999999.99。
33 MySQL 有关权限的表都有哪几个?
MySQL 服务器通过权限表来控制用户对数据库的访问,权限表存放在 MySQL 数据库里,由 MySQL_install_db 脚本初始化。这些权限表分别 user,db,table_priv,columns_priv 和 host。
34 列的字符串类型可以是什么?
字符串类型是:
1 SET
2 BLOB
3 ENUM
4 CHAR
5 TEXT
35 MySQL 数据库作发布系统的存储,一天五万条以上的增量,预 计运维三年,怎么优化?
1 设计良好的数据库结构,允许部分数据冗余,尽量避免 join 查询,提高效率。
2 选择合适的表字段数据类型和存储引擎,适当的添加索引。
3 MySQL 库主从读写分离。
4 找规律分表,减少单表中的数据量提高查询速度。
5 添加缓存机制,比如 memcached,apc 等。
6 不经常改动的页面,生成静态页面。
7 书写高效率的 SQL。比如 SELECT * FROM TABEL 改为 SELECT field_1,field_2, field_3 FROM TABLE.
36 锁的优化策略
1 读写分离
2 分段加锁
3 减少锁持有的时间
4.多个线程尽量以相同的顺序去获取资源不能将锁的粒度过于细化,不然可能会出现线程的加锁和释放 次数过多,反而效率不如一次加一把大锁。
37 索引的底层实现原理和优化
B+树,经过优化的 B+树
主要是在所有的叶子结点中增加了指向下一个叶子节点的指针,因此 InnoDB 建议为大部分表使用默认 自增的主键作为主索引。
38 什么情况下设置了索引但无法使用
1 以“%”开头的 LIKE 语句,模糊匹配
2 OR 语句前后没有同时使用索引
3 数据类型出现隐式转化(如 varchar 不加单引号的话可能会自动转换为 int 型)
39 实践中如何优化 MySQL
最好是按照以下顺序优化:
1 SQL 语句及索引的优化
2 数据库表结构的优化
3 系统配置的优化
4 硬件的优化
详细可以查看 阿里 P8 架构师谈:MySQL 慢查询优化、索引优化、以及表等优化总结
40 优化数据库的方法
1 选取最适用的字段属性,尽可能减少定义字段宽度,尽量把字段设置 NOTNULL,例如’省份’、’性 别’最好适用 ENUM
2 使用连接(JOIN)来代替子查询
3 适用联合(UNION)来代替手动创建的临时表
4 事务处理
5 锁定表、优化事务处理
6 适用外键,优化锁定表
7 建立索引
8 优化查询语句