数据库是按照数据结构来组织,存储和管理数据的仓库;是一个长期存储在计算机内的,有组织的,可共享的,统一管理的大量数据的集合;访问数据库在内存的数据,数据需要落盘后才会返回结果;
mysql中oltp是用B+树或lsm存储数据;olap是用列式存储的;
DML是数据操作语言的简称,即增删改;
DQL是数据查询语言简称,即select;
DDL是数据定义语言简称,即create创建,alter修改,drop删除表,试图,数据库对像等;
DCL是数据控制语言简称,grant授予用户权限,revoke收回用户权限;
TCL是事务控制语言简称,commit事务提交,rollback事务回滚;
mysql内部执行方式,网络处理模型使用了io多路复用select+阻塞io,每条线程处理一条连接的数据,所以mysql命令处理是多线程并发处理的模式,线程的默认配置最大数为151;mysql是采用短链接的方式,如果连接长时间没有使用,会断开这条连接,回收对应的线程资源;
mysql体系结构
connection pool提前分配了一些线程,当一条连接到达,我们就分配线程给这条连接;其作用有鉴权密码验证,线程复用,连接限制,检查内存,caches等;
sql interface对sql语言进行词法语法分析,生成语法树;parser用于过滤表等是否存在的情况;Optimizer优化器用于制定执行计划,因为不同的sql语句有不同的执行方式,选择执行成本最小的计划;Caches&Buffers用于缓存热点数据,如果缓存中没有对应的数据就得检索磁盘加载数据;
mysql默认使用的可插拔引擎是InnoDB;
数据库设计三范式和反范式
三范式是为了降低空间,其内容有列不可分,依赖主键(联合索引),在依赖主键的基础上直接依赖;反范式是通过增加空间来减少运行时间,允许冗余存储,为了提升查询效率;
CRUD
百分之九十以上的事情都是在做CRUD,百分之九考虑表是怎么设计的,剩下百分之一的时间可能就是做些索引优化之类的事情;
crud中有五大约束,not null 非空约束,auto_increment 自增约束,unique 唯一约束,primary 主键约束,foreign 外键约束;
删除数据有三种方式,drop删除整张表,表结构和表数据,包括索引,约束,触发器等,速度最快,不能回滚;truncate删除表数据,其他保留,速度较快,不能回滚,以页为单位进行删除;delete删除部分或全部数据,其他保留,条件删除,速度最慢,可以回滚,逐行删除;
高级查询
1)分组聚合
去除重复,合并重复,通过聚合函数实现;
2)联表查询
把表想象成集合,分为内联inner join,内联是取交集的意思;外联left join或right join或full join;
3)子查询