前些天发现了一个巨牛的人工智能学习网站,内容通俗易懂、风趣幽默,忍不住想分享一下。对人工智能感兴趣的同学可以去看看哦
一、数据库概述
(1)数据库概述
数据库(database)是按照数据结构组织、存储和管理数据的仓库,存放数据的仓库
(2)数据库的分类
数据库主要分为关系型数据库和非关系型数据库,关系型数据库又称为SQL数据库,非关系型数据库又称为NoSQL数据库或Not only SQL数据库
区分是否为关系数据库还是非关系数据库其实只需要查看是否可以使用SQL语句,关系型数据库可以使用SQL语句,而非关系型数据库无法使用
- 关系型数据库
数据拥有固定的存储结构,通过库——表——数据的方式存储,存储时会有表的结构化关系,主要代表有Mysql、mariadb、oracle、SQL Server
关系型数据库存储数据的过程:解析SQL语句——连接层——磁盘存取——结构化成表
关系型数据库的优势:
- 容易理解,二维表
(即XY轴心表)
的结构非常容易理解 - 使用方便,通用的SQL语句使得操作关系型数据变得非常方便
(关系型数据库都可以使用SQL语句)
- 易于维护,数据库的ACID属性
(原子性、一致性、隔离性、持久性)
,大大降低了数据冗余和数据不一致的概率
关系型数据库的缺点:
- 海量数据的读写效率低,对于每秒上万次请求的高并发网站来说,传统关系型数据库的硬盘I/O是一个很大的挑战
- 没有高扩展性和可用性,在基于web的结构中,数据库是最难横向扩展的,当一个应用系统的用户量和访问量日益增加时,数据库没有办法像一些web服务一样简单的通过添加更多硬件和服务节点来扩展性能和负载能力
关系型数据库最大的优点就是因为事务的一致性,这个特性,使得关系型数据库可以适用于一切要求一致性比较高的系统中,例如银行系统。但是在大部分网页应用中,对于这种一致性不是那么严格,允许数据一致有一定时间的间隔,所以关系型数据库这个特点就不是那么重要了,相反,关系型数据为了维护一致性所付出的代价就是读写性能比较差,而像微博、脸书这类应用,对于并发读写能力有很高的要求,很显然在这种应用上使用关系型数据库是弊大于利的,所以必须创造一种新的数据结构存储来替代这种传统的关系型数据库,所以就应运而生出了非关系数据库
- 非关系数据库
非关系数据库的产生,就是为了加快客户端的访问速度才出现的。
非关系数据库是通过key:value的形式存储的,即键值对,例如name=rzy 键为name,值为rzy
NoSQL主要是指那些非关系型的、分布式的,主要代表Redis、MongoDB
所有的非关系型数据库都是尽可能的将数据放到内存当中,而关系型数据都是放在硬盘,内存的读写肯定是比硬盘快的这也非关系数据库比关系型数据库读写能力强的一个原因
NoSQL的存储理念是以键值来存储,且结构不稳定,每一个元组都可以有不一样的字段,这种就不会局限于固定的结构,可以减少一些时间和空间的开销。使用这种方式,为了获取用户指定的不同信息,非关系型数据库不会像关系型数据库那样,进行多表查询,而实仅仅需要根据key来取出相应的value值即可,避免了关系型数据复杂的查询关系,可以增快查询的效率,这也意味着NoSQL中的键名是不能重复的,具有唯一性
二、Mysql概述
(1)Mysql概述
MySQL是一个关系型数据库,由瑞典MySQL AB公司开发,目前已经被Oracle收购。
Mysql是一个真正的多用户、多线程的SQL数据库。其使用的SQL(结构化查询语言)是世界上最流行的和标准化的数据库语言,每个关系型数据库都可以使用。
MySQL是以客户机/服务器结构实现的,也就是俗称的C/S结构,它由一个服务器守护程序mysqld和很多不同的客户程序和库组成。
(2)Mysql的存储原理
用户输入SQL语句,MySQL处理然后进行存储的过程
连接器Connectors:即用户通过什么方式去访问数据库,数据库一般都会保留一些接口,使得一些语言可以调用数据库的命令,如Python、PHP等
- 连接池: 最上层负责和客户端进行连接,比如jdbc,odbj这样的数据库连接的API(应用程序接口),在这一层有连接池的概念,类似于线程池,连接池可以同时处理很多个数据库请求。同时这一层有SSL的安全概念,可以确保连接是安全的
- SQL接口: 当SQL语句进入MySQL后,会先到SQL接口中,这一层是封装层,将传过来的SQL语句拆散,将底层的结果封装成SQL的数据格式,就是把SQL语句拆散,然后重组成mysql系统认识的语言
- 解析器: 这一层负责将SQL语句进行拆分,验证,如果语句有问题那么就返回错误,如果没问题就继续向下执行,即写错SQL语句后会报错
- 优化器: 对SQL查询的结果优化处理,产生多种执行计划,最终数据库会选择最优化的方案去执行,尽快返会结果。
- 缓存: 当用户查询数据库的数据时,缓存会对要查询的SQL语句进行hash后缓存,如果下一次是相同的查询语句,则在SQL接口之后直接返回结果,就像Nginx缓存一样,查询过一次后会进行缓存,下次用户再次查询相同数据就会直接返回,加快查询效率
- 存储引擎: MySQL有很多种存储引擎,每一种存储引擎有不同的特性,他们负责组织文件的存放形式,位置,访问文件的方法等等。比较常用的有innoDB,MyISAM,MEMORY等,默认的是innoDB存储引擎,存储引擎可以进行修改,但是不推荐,因为每个存储引擎都不一样,可能会导致某些字符不识别等问题
- 文件系统: 真正存放物理文件的单位,即硬盘
(3)使用cmake编译mysql参数说明
编译多次时,需要删除CMAKE的缓存,rm -rf /usr/src/mysql-5.7.12/CMakeCache.txt
命令 | 作用 |
-DCMAKE_INSTALL_PREFIX=/usr/local/mysql | 指定MySQL安装的根目录 |
-DMYSQL_DATADIR=/mydata/mysql/data | 指定MySQL数据库文件存放目录 |
-DDEFAULT_CHARSET=utf8 | 设置默认字符集为utf8 |
-DDEFAULT_COLLATION=utf8_general_ci | 设置默认字符校对 |
-DMYSQL_TCP_PORT=3306 | 设置MySQL的监听端口 |
-DMYSQL_USER=mysql | 设置MySQL用户名 |
-DWITH_MYISAM_STORAGE_ENGINE=1 | 安装MySQL的myisam数据库引擎 |
-DWITH_INNOBASE_STORAGE_ENGINE=1 | 安装MySQL的innodb数据库引擎 |
-DWITH_ARCHIVE_STORAGE_ENGINE=1 | 安装MySQL的archive数据库引擎 |
-DWITH_BLACKHOLE_STORAGE_ENGINE=1 | 安装MySQL的blackhole数据库引擎 |
-DWITH_MEMORY_STORAGE_ENGINE=1 | 安装MySQL的memory数据库引擎 |
-DENABLE_DOWNLOADS=1 | 编译时允许自主下载相关文件 |
-DDOWNLOAD_BOOST=1 | 允许下载BOOST |
-DWITH_BOOST=/usr/local/boost | 指定系统中存在的BOOST |
-DSYSCONFDIR=/etc | MySQL配置文件所在目录 |
-DWITH_READLINE=1 | MySQL的readline library |
-DMYSQL_UNIX_ADDR=/var/run/mysql/mysql.sock | MySQL的通讯目录 |
-DENABLED_LOCAL_INFILE=1 | 启用加载本地数据 |
-DWITH_PARTITION_STORAGE_ENGINE=1 | 启动mysql的分区存储结构 |
-DEXTRA_CHARSETS=all | 使MySQL支持所有的扩展字符 |
-DWITH_DEBUG=0 | 禁用调试模式 |
-DMYSQL_MAINTAINER_MODE=0 | 禁用维护模式 |
-DWITH_SSL:STRING=bundled | 通讯时支持ssl协议 |
-DWITH_ZLIB:STRING=bundled | 允许使用zlib library |
(4)Mysql自带的四个数据库
在mysql安装完成之后,进入mysql会发现有四个库,这四个库是默认就有的,下面是这四个库的解释:
- information_schema: 这是一个信息数据库,它保存着关于Mysql服务器所维护的所有其他数据库的信息,例如数据库名称、数据库的表、表栏的数据类型和访问权限等
- mysql: 这个主要负责存储数据库的用户、权限设置、关键字等mysql自己需要使用的控制和管理信息
- performance_schema: 这个主要用于收集数据库服务器性能参数,并且库里的表的存储引擎均为performance_schema,而用户是不能创建存储引擎为performance_schema的表的
- sys: 这个库的所有数据源来自performance_schema,目标是把performance_schema的复杂度降低,让DBA(数据库管理员)能够更好的阅读这个库中的内容,让DBA更快的了解DB(数据库)的运行情况