Mysql简介(上)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
简介: Mysql简介(上)

前些天发现了一个巨牛的人工智能学习网站,内容通俗易懂、风趣幽默,忍不住想分享一下。对人工智能感兴趣的同学可以去看看哦


点击跳转到网站。


一、数据库概述


(1)数据库概述


数据库(database)是按照数据结构组织、存储和管理数据的仓库,存放数据的仓库


(2)数据库的分类


数据库主要分为关系型数据库和非关系型数据库,关系型数据库又称为SQL数据库,非关系型数据库又称为NoSQL数据库或Not only SQL数据库


区分是否为关系数据库还是非关系数据库其实只需要查看是否可以使用SQL语句,关系型数据库可以使用SQL语句,而非关系型数据库无法使用


  • 关系型数据库


数据拥有固定的存储结构,通过库——表——数据的方式存储,存储时会有表的结构化关系,主要代表有Mysql、mariadb、oracle、SQL Server

关系型数据库存储数据的过程:解析SQL语句——连接层——磁盘存取——结构化成表


关系型数据库的优势:


  1. 容易理解,二维表 (即XY轴心表) 的结构非常容易理解
  2. 使用方便,通用的SQL语句使得操作关系型数据变得非常方便 (关系型数据库都可以使用SQL语句)
  3. 易于维护,数据库的ACID属性 (原子性、一致性、隔离性、持久性) ,大大降低了数据冗余和数据不一致的概率


关系型数据库的缺点:


  1. 海量数据的读写效率低,对于每秒上万次请求的高并发网站来说,传统关系型数据库的硬盘I/O是一个很大的挑战
  2. 没有高扩展性和可用性,在基于web的结构中,数据库是最难横向扩展的,当一个应用系统的用户量和访问量日益增加时,数据库没有办法像一些web服务一样简单的通过添加更多硬件和服务节点来扩展性能和负载能力


关系型数据库最大的优点就是因为事务的一致性,这个特性,使得关系型数据库可以适用于一切要求一致性比较高的系统中,例如银行系统。但是在大部分网页应用中,对于这种一致性不是那么严格,允许数据一致有一定时间的间隔,所以关系型数据库这个特点就不是那么重要了,相反,关系型数据为了维护一致性所付出的代价就是读写性能比较差,而像微博、脸书这类应用,对于并发读写能力有很高的要求,很显然在这种应用上使用关系型数据库是弊大于利的,所以必须创造一种新的数据结构存储来替代这种传统的关系型数据库,所以就应运而生出了非关系数据库


  • 非关系数据库


非关系数据库的产生,就是为了加快客户端的访问速度才出现的。


非关系数据库是通过key:value的形式存储的,即键值对,例如name=rzy 键为name,值为rzy


NoSQL主要是指那些非关系型的、分布式的,主要代表Redis、MongoDB


所有的非关系型数据库都是尽可能的将数据放到内存当中,而关系型数据都是放在硬盘,内存的读写肯定是比硬盘快的这也非关系数据库比关系型数据库读写能力强的一个原因


NoSQL的存储理念是以键值来存储,且结构不稳定,每一个元组都可以有不一样的字段,这种就不会局限于固定的结构,可以减少一些时间和空间的开销。使用这种方式,为了获取用户指定的不同信息,非关系型数据库不会像关系型数据库那样,进行多表查询,而实仅仅需要根据key来取出相应的value值即可,避免了关系型数据复杂的查询关系,可以增快查询的效率,这也意味着NoSQL中的键名是不能重复的,具有唯一性


二、Mysql概述


(1)Mysql概述


MySQL是一个关系型数据库,由瑞典MySQL AB公司开发,目前已经被Oracle收购。


Mysql是一个真正的多用户、多线程的SQL数据库。其使用的SQL(结构化查询语言)是世界上最流行的和标准化的数据库语言,每个关系型数据库都可以使用。


MySQL是以客户机/服务器结构实现的,也就是俗称的C/S结构,它由一个服务器守护程序mysqld和很多不同的客户程序和库组成。


20210624155511357.png


(2)Mysql的存储原理


用户输入SQL语句,MySQL处理然后进行存储的过程


20210624155528573.png

连接器Connectors:即用户通过什么方式去访问数据库,数据库一般都会保留一些接口,使得一些语言可以调用数据库的命令,如Python、PHP等


  1. 连接池: 最上层负责和客户端进行连接,比如jdbc,odbj这样的数据库连接的API(应用程序接口),在这一层有连接池的概念,类似于线程池,连接池可以同时处理很多个数据库请求。同时这一层有SSL的安全概念,可以确保连接是安全的


  1. SQL接口: 当SQL语句进入MySQL后,会先到SQL接口中,这一层是封装层,将传过来的SQL语句拆散,将底层的结果封装成SQL的数据格式,就是把SQL语句拆散,然后重组成mysql系统认识的语言


  1. 解析器: 这一层负责将SQL语句进行拆分,验证,如果语句有问题那么就返回错误,如果没问题就继续向下执行,即写错SQL语句后会报错


  1. 优化器: 对SQL查询的结果优化处理,产生多种执行计划,最终数据库会选择最优化的方案去执行,尽快返会结果。


  1. 缓存: 当用户查询数据库的数据时,缓存会对要查询的SQL语句进行hash后缓存,如果下一次是相同的查询语句,则在SQL接口之后直接返回结果,就像Nginx缓存一样,查询过一次后会进行缓存,下次用户再次查询相同数据就会直接返回,加快查询效率


  1. 存储引擎: MySQL有很多种存储引擎,每一种存储引擎有不同的特性,他们负责组织文件的存放形式,位置,访问文件的方法等等。比较常用的有innoDB,MyISAM,MEMORY等,默认的是innoDB存储引擎,存储引擎可以进行修改,但是不推荐,因为每个存储引擎都不一样,可能会导致某些字符不识别等问题


  1. 文件系统: 真正存放物理文件的单位,即硬盘


(3)使用cmake编译mysql参数说明


编译多次时,需要删除CMAKE的缓存,rm -rf /usr/src/mysql-5.7.12/CMakeCache.txt


命令 作用
-DCMAKE_INSTALL_PREFIX=/usr/local/mysql 指定MySQL安装的根目录
-DMYSQL_DATADIR=/mydata/mysql/data 指定MySQL数据库文件存放目录
-DDEFAULT_CHARSET=utf8 设置默认字符集为utf8
-DDEFAULT_COLLATION=utf8_general_ci 设置默认字符校对
-DMYSQL_TCP_PORT=3306 设置MySQL的监听端口
-DMYSQL_USER=mysql 设置MySQL用户名
-DWITH_MYISAM_STORAGE_ENGINE=1 安装MySQL的myisam数据库引擎
-DWITH_INNOBASE_STORAGE_ENGINE=1 安装MySQL的innodb数据库引擎
-DWITH_ARCHIVE_STORAGE_ENGINE=1 安装MySQL的archive数据库引擎
-DWITH_BLACKHOLE_STORAGE_ENGINE=1 安装MySQL的blackhole数据库引擎
-DWITH_MEMORY_STORAGE_ENGINE=1 安装MySQL的memory数据库引擎
-DENABLE_DOWNLOADS=1 编译时允许自主下载相关文件
-DDOWNLOAD_BOOST=1 允许下载BOOST
-DWITH_BOOST=/usr/local/boost 指定系统中存在的BOOST
-DSYSCONFDIR=/etc MySQL配置文件所在目录
-DWITH_READLINE=1 MySQL的readline library
-DMYSQL_UNIX_ADDR=/var/run/mysql/mysql.sock MySQL的通讯目录
-DENABLED_LOCAL_INFILE=1 启用加载本地数据
-DWITH_PARTITION_STORAGE_ENGINE=1 启动mysql的分区存储结构
-DEXTRA_CHARSETS=all 使MySQL支持所有的扩展字符
-DWITH_DEBUG=0 禁用调试模式
-DMYSQL_MAINTAINER_MODE=0 禁用维护模式
-DWITH_SSL:STRING=bundled 通讯时支持ssl协议
-DWITH_ZLIB:STRING=bundled 允许使用zlib library


(4)Mysql自带的四个数据库


在mysql安装完成之后,进入mysql会发现有四个库,这四个库是默认就有的,下面是这四个库的解释:


  1. information_schema: 这是一个信息数据库,它保存着关于Mysql服务器所维护的所有其他数据库的信息,例如数据库名称、数据库的表、表栏的数据类型和访问权限等
  2. mysql: 这个主要负责存储数据库的用户、权限设置、关键字等mysql自己需要使用的控制和管理信息
  3. performance_schema: 这个主要用于收集数据库服务器性能参数,并且库里的表的存储引擎均为performance_schema,而用户是不能创建存储引擎为performance_schema的表的
  4. sys: 这个库的所有数据源来自performance_schema,目标是把performance_schema的复杂度降低,让DBA(数据库管理员)能够更好的阅读这个库中的内容,让DBA更快的了解DB(数据库)的运行情况
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
8天前
|
关系型数据库 MySQL Linux
MySQL原理简介—6.简单的生产优化案例
本文介绍了数据库和存储系统的几个主题: 1. **MySQL日志的顺序写和数据文件的随机读指标**:解释了磁盘随机读和顺序写的原理及对数据库性能的影响。 2. **Linux存储系统软件层原理及IO调度优化原理**:解析了Linux存储系统的分层架构,包括VFS、Page Cache、IO调度等,并推荐使用deadline算法优化IO调度。 3. **数据库服务器使用的RAID存储架构**:介绍了RAID技术的基本概念及其如何通过多磁盘阵列提高存储容量和数据冗余性。 4. **数据库Too many connections故障定位**:分析了MySQL连接数限制问题的原因及解决方法。
|
9天前
|
SQL Java 关系型数据库
MySQL原理简介—3.生产环境的部署压测
本文介绍了Java系统和数据库在高并发场景下的压测要点: 1. 普通系统在4核8G机器上每秒能处理几百个请求 2. 高并发下数据库建议使用8核16G或更高配置的机器 3. 数据库部署后需进行基准压测,以评估其最大承载能力 4. QPS和TPS的区别及重要性 5. 压测时需关注IOPS、吞吐量、延迟 6. 除了QPS和TPS,还需监控CPU、内存、磁盘IO、网络带宽 7. 影响每秒可处理并发请求数的因素包括线程数、CPU、内存、磁盘IO和网络带宽 8. Sysbench是数据库压测工具,可构造测试数据并模拟高并发场景 9. 在增加线程数量的同时,必须观察机器的性能,确保各硬件负载在合理范围
113 72
|
11天前
|
SQL 存储 关系型数据库
MySQL原理简介—1.SQL的执行流程
本文介绍了MySQL驱动、数据库连接池及SQL执行流程的关键组件和作用。主要内容包括:MySQL驱动用于建立Java系统与数据库的网络连接;数据库连接池提高多线程并发访问效率;MySQL中的连接池维护多个数据库连接并进行权限验证;网络连接由线程处理,监听请求并读取数据;SQL接口负责执行SQL语句;查询解析器将SQL语句解析为可执行逻辑;查询优化器选择最优查询路径;存储引擎接口负责实际的数据操作;执行器根据优化后的执行计划调用存储引擎接口完成SQL语句的执行。整个流程确保了高效、安全地处理SQL请求。
131 75
|
6天前
|
SQL 存储 关系型数据库
MySQL原理简介—9.MySQL索引原理
本文详细介绍了MySQL索引的设计与使用原则,涵盖磁盘数据页的存储结构、页分裂机制、主键索引设计及查询过程、聚簇索引和二级索引的原理、B+树索引的维护、联合索引的使用规则、SQL排序和分组时如何利用索引、回表查询对性能的影响以及索引覆盖的概念。此外还讨论了索引设计的案例,包括如何处理where筛选和order by排序之间的冲突、低基数字段的处理方式、范围查询字段的位置安排,以及通过辅助索引来优化特定查询场景。总结了设计索引的原则,如尽量包含where、order by、group by中的字段,选择离散度高的字段作为索引,限制索引数量,并针对频繁查询的低基数字段进行特殊处理等。
MySQL原理简介—9.MySQL索引原理
|
6天前
|
SQL 监控 关系型数据库
MySQL原理简介—12.MySQL主从同步
本文介绍了四种为MySQL搭建主从复制架构的方法:异步复制、半同步复制、GTID复制和并行复制。异步复制通过配置主库和从库实现简单的主从架构,但存在数据丢失风险;半同步复制确保日志复制到从库后再提交事务,提高了数据安全性;GTID复制简化了配置过程,增强了复制的可靠性和管理性;并行复制通过多线程技术降低主从同步延迟,保证数据一致性。此外,还讨论了如何使用工具监控主从延迟及应对策略,如强制读主库以确保即时读取最新数据。
MySQL原理简介—12.MySQL主从同步
|
8天前
|
SQL 缓存 关系型数据库
MySQL原理简介—7.redo日志的底层原理
本文介绍了MySQL中redo日志和undo日志的主要内容: 1. redo日志的意义:确保事务提交后数据不丢失,通过记录修改操作并在系统宕机后重做日志恢复数据。 2. redo日志文件构成:记录表空间号、数据页号、偏移量及修改内容。 3. redo日志写入机制:redo日志先写入Redo Log Buffer,再批量刷入磁盘文件,减少随机写以提高性能。 4. Redo Log Buffer解析:描述Redo Log Buffer的内存结构及刷盘时机,如事务提交、Buffer过半或后台线程定时刷新。 5. undo日志原理:用于事务回滚,记录插入、删除和更新前的数据状态,确保事务可完整回滚。
|
7天前
|
SQL 缓存 关系型数据库
MySQL原理简介—8.MySQL并发事务处理
这段内容深入探讨了SQL语句执行原理、事务并发问题、MySQL事务隔离级别及其实现机制、锁机制以及数据库性能优化等多个方面。
|
10天前
|
存储 SQL 缓存
MySQL原理简介—2.InnoDB架构原理和执行流程
本文介绍了MySQL中更新语句的执行流程及其背后的机制,主要包括: 1. **更新语句的执行流程**:从SQL解析到执行器调用InnoDB存储引擎接口。 2. **Buffer Pool缓冲池**:缓存磁盘数据,减少磁盘I/O。 3. **Undo日志**:记录更新前的数据,支持事务回滚。 4. **Redo日志**:确保事务持久性,防止宕机导致的数据丢失。 5. **Binlog日志**:记录逻辑操作,用于数据恢复和主从复制。 6. **事务提交机制**:包括redo日志和binlog日志的刷盘策略,确保数据一致性。 7. **后台IO线程**:将内存中的脏数据异步刷入磁盘。
|
6天前
|
SQL 关系型数据库 MySQL
MySQL原理简介—11.优化案例介绍
本文介绍了四个SQL性能优化案例,涵盖不同场景下的问题分析与解决方案: 1. 禁止或改写SQL避免自动半连接优化。 2. 指定索引避免按聚簇索引全表扫描大表。 3. 按聚簇索引扫描小表减少回表次数。 4. 避免产生长事务长时间执行。
|
6天前
|
SQL 存储 关系型数据库
MySQL原理简介—10.SQL语句和执行计划
本文介绍了MySQL执行计划的相关概念及其优化方法。首先解释了什么是执行计划,它是SQL语句在查询时如何检索、筛选和排序数据的过程。接着详细描述了执行计划中常见的访问类型,如const、ref、range、index和all等,并分析了它们的性能特点。文中还探讨了多表关联查询的原理及优化策略,包括驱动表和被驱动表的选择。此外,文章讨论了全表扫描和索引的成本计算方法,以及MySQL如何通过成本估算选择最优执行计划。最后,介绍了explain命令的各个参数含义,帮助理解查询优化器的工作机制。通过这些内容,读者可以更好地理解和优化SQL查询性能。