一、关系型数据库和非关系型数据库概述
1.1关系型数据库
是一个结构化的数据库,创建在关系模型基础上 (二维表格模型)基础上,一般面向于记录
SQL 语句(标准数据查询语言)就是一种基于关系型数据库的语言,用于执行对关系型数据库中数据的检索和操作
主流的关系型数据库包括 Oracle、MySQL、SQL Server、Microsoft Access、DB2 、PostgreSQL等
以上数据库在使用的时候必须先建库建表设计表结构,然后存储数据的时候按表结构去存,如果数据与表结构不匹配就会存储失败
E-R图: 实体-关系-属性
关系型数据库:主要以二维表结构方式存储数据/实体属性,同时相互关联的一种数据库类型
(1)数据以表格的形式出现
(2)每行为各种记录名称
(3)每列为记录名称所对应的数据域
(4)许多的行和列组成一张表单
(5)若干的表单组成database
1.2非关系型数据库
NoSQL (NoSQL=NotOnlySQL), 意思是“不仅仅是SQL",是非关系型数据库的总称
除了主流的关系型数据库外的数据库,都认为是非关系型
不需要预先建库建表定义数据存储表结构,每条记录可以有不同的数据类型和字段个数(比如微信群聊里的文字、图片、视频、音乐等)
主流的NoSQL数据库有Redis、MongBD、Hbase、Memcached等
Mongbd:能提供高性能,能自动分片,可运行在多台服务器上,易于安装,可以为客户提供专业支持:高数据,横向扩展;不支持连接,数据量大嵌套有限,增加内存会有问题
二、关系型数据库和非关系型数据库的区别
2.1数据存储方式不同
关系型和非关系型数据库的主要差异是数据存储的方式。
关系型数据天然就是表格式的,因此存储在数据表的行和列中。数据表可以彼此关联协作存储,也很容易提取数据。
与其相反,非关系型数据不适合存储在数据表的行和列中,而是大块组合在一起。非关系型数据通常存储在数据集中,就像文档、键值对或者图结构。你的数据及其特性是选择数据存储和提取方式的首要影响因素。
关系型:依赖于关系模型E-R图,同时以表格式的方式存储数据
非关系型:除了以表格形式存储之外,通常会以大块的形式组合在一一起进行存储数据
2.2扩展方式不同
SQL和NoSQL数据库最大的差别可能是在扩展方式上,要支持日益增长的需求当然要扩展。
要支持更多并发量,SQL数据库是纵向扩展,也就是说提高处理能力,使用速度更快速的计算机,这样处理相同的数据集就更快了。因为数据存储在关系表中,操作的性能瓶颈可能涉及很多个表,这都需要通过提高计算机性能来客服。虽然SQL数据库有很大扩展空间,但最终肯定会达到纵向扩展的上限。
而NoSQL数据库是横向扩展的。因为非关系型数据存储天然就是分布式的,NoSQL数据库的扩展可以通过给资源池添加更多普通的数据库服务器(节点)来分担负载。
关系型:纵向(天然表格式)
非关系型:横向(天然分布式)
2.3对事务性的支持不同
如果数据操作需要高事务性或者复杂数据查询需要控制执行计划,那么传统的SQL数据库从性能和稳定性方面考虑是你的最佳选择。SQL数据库支持对事务原子性细粒度控制,并且易于回滚事务。
虽然NoSQL数据库也可以使用事务操作,但稳定性方面没法和关系型数据库比较,所以它们真正闪亮的价值是在操作的扩展性和大数据量处理方面。
关系型:特别适合高事务性要求和需要控制执行计划的任务
非关系型:此处会稍显弱势,其价值点在于高扩展性和大数据量处理方面
2.4关系型数据库和非关系型数据库的优点
2.4.1关系型数据库
(1)安全性高(持久化)
(2)事务处理能力强
(3)任务控制能力强
(4)可以做日志备份、恢复、容灾的能力更强
2.4.2非关系型数据库
(1)数据保存在缓存中,利于读取速度、查询数据
(2)架构中位置灵活
(3)分布式、扩展性高
三、非关系型数据库产生的背景
可用于应对 Web2.0 纯动态网站类型的三高问题
(1)High performance——对数据库高并发读写需求
(2)Huge Storage——对海量数据高效存储与访问需求
(3)High Scalability && High Availability——对数据库高可扩展性与高可用性需求
关系型数据库和非关系型数据库都有各自的特点与应用场景,两者的紧密结合将会给Web2.0的数据库发展带来新的思路。让关系数据库关注在关系上,非关系型数据库关注在存储上。例如,在读写分离的MySQL数据库环境中,可以把经常访问的数据存储在非关系型数据库中,提升访问速度
总结:
关系型数据库:
实例–>数据库–>表(table)–>记录行(row)、数据字段(column)–>存储数据
非关系型数据库:
实例–>数据库–>集合(collection)–>键值对(key-value)
非关系型数据库不需要手动建数据库和集合(表)
关系数据库: 保存位置 磁盘
非关数据库(内存/缓存数据库): 保存的位置是缓存/内存(效率、速度块〉特殊的是redis,因为redis可以将内存中的数据保存在磁盘中
高热数据保存在resis中,当web服务器过来访问的时候,读取redis中的高热数据。如果redis中没有数据,再从mysql数据库中读取数据
Mysql 高热数据——》redis web ——》redis——》mysql 类型:CPU——》内存/缓存—》磁盘
四、Redis概述
4.1redis简介
Redis 是一个开源的、使用 C 语言编写的 NoSQL 数据库。
Redis 基于内存运行并支持持久化,采用key-value(键值对)的存储形式,是目前分布式架构中不可或缺的一环。
Redis服务器程序是单进程模型,也就是在一台服务器上可以同时启动多个Redis进程,Redis的实际处理速度则是完全依靠于主进程的执行效率。
若在服务器上只运行一个Redis进程,当多个客户端同时访问时,服务器的处理能力是会有一定程度的下降;
若在同一台服务器上开启多个Redis进程,Redis在提高并发处理能力的同时会给服务器的CPU造成很大压力。即:在实际生产环境中,需要根据实际的需求来决定开启多少个Redis进程。
若对高并发要求更高一些,可能会考虑在同一台服务器上开启多个进程。若 CPU 资源比较紧张,采用单进程即可。
redis软件包下载中文网 https://www.redis.net.cn/
redis单进程模型的原因
(1)备份
(2)抗高并发的同时尽量不给CPU造成太大的压力
若对高并发要求更高一些,可能会考虑在同一台服务器上开启多个进程。若CPU资源比较紧张,采用单进程即可
4.2redis优点
redis具有以下几个优点:
(1)具有极高的数据读写速度:数据读取的速度最高可达到110000次/s,数据写入速度最高可达到81000次/s
(2)支持丰富的数据类型:支持key-value、 Strings、Lists、Hashes ( 散列值)、Sets及OrderedSets等数据类型操作。 PS : string 字符串(可以为整形、浮点和字符型,统称为元素) list列表:(实现队列,元素不唯一,先入先出原则) set 集合:(各不相同的元素) hash hash散列值:( hash的key必须是唯一的) set /ordered sets集合/有序集合
string:字符串(可以为整形、浮点和字符型,统称为元素) list:列表:(实现队列,元素不唯一,先入先出原则) set:集合:(各不相同的元素) hash:hash散列值:( hash的key必须是唯一的) set/ordered sets集合/有序集合
(3)支持数据的持久化:可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用
(4)原子性:Redis所有操作都是原子性的
(5)支持数据备份:即master-salve 模式的数据备份
Redis作为基于内存运行的数据库,缓存是其最常应用的场景之一。除此之外,Redis常见应用场景还包括获取最新N个数据的操作、排行榜类应用、计数器应用、存储关系、实时分析系统、日志记录
4.3redis为什么这么快?
(1)redis是一款纯内存结构,避免了磁盘I/O等耗时操作
(2)redis命令处理的核心模块为单线程,减少了锁竞争,以及频繁创建线程和销毁线程的代价,减少了线程上下文切换的消耗
(3)采用了I/O多路复用机制,大大提升了并发效率
注:在redis 6.0中新增加的多线程也只是针对处理网络请求过程采用了多线性,而数据的读写命令,仍然是单线程处理的
五、Redis安装部署
5.1关闭防火墙和SElinux systemctl stop firewalld systemctl disable firewalld setenforce 0
5.2安装gcc gcc-c++编译器
yum install -y gcc gcc-c++ make
5.3切换至/opt目录,把下载好的安装包上传进来并解压
cd /opt/ wget http://download.redis.io/releases/redis-5.0.7.tar.gz tar zxvf redis-5.0.7.tar.gz
5.4进入目录然后编译安装
cd /opt/redis-5.0.7/ make make PREFIX=/usr/local/redis install #编译并且编译安装 #安装目录为/usr/local/redis
由于Redis源码包中直接提供了Makefile 文件,所以在解压完软件包后,不用先执行./configure 进行配置,可直接执行make与make install命令进行安装 5.5执行install_server.sh脚本 cd /opt/redis-5.0.7/utils ./install_server.sh …… 慢慢回车 Please select the redis executable path [] 手动输入 /usr/local/redis/bin/redis-server
Selected config: Port : 6379 #默认侦听端口为6379 Config file : /etc/redis/6379.conf #配置文件路径 Log file : /var/log/redis_6379.log #日志文件路径 Data dir : /var/lib/ redis/6379 #数据文件路径 Executable : /usr/local/redis/bin/redis-server #可执行文件路径 Cli Executable : /usr/local/redis/bin/redis-cli #客户端命令工具
5.6优化路径并查端口是否打开
把redis的可执行程序文件放入路径环境变量的目录中便于系统识别 ln -s /usr/local/redis/bin/* /usr/local/bin/ /etc/init.d/redis_6379 stop #停止 /etc/init.d/redis_6379 start #启动 /etc/init.d/redis_6379 restart #重启 /etc/init.d/redis_6379 status #状态 #当install_server.sh 脚本运行完毕,Redis服务就已经启动,默认侦听端口为6379 netstat -natp | grep redis
5.7修改配置文件
vim /etc/redis/6379.conf bind 127.0.0.1 192.168.145.22 #70行,添加监听的主机地址 port 6379 #93行,Redis默认的监听端口 daemonize yes #137行,启用守护进程 pidfile /var/run/redis_6379.pid #159行,指定PID文件 loglevel notice #167行,日志级别 logfile /var/log/redis_6379.log #172行,指定日志文件
5.8重启redis查看监听的地址
/etc/init.d/redis_6379 restart #重启 ss -anpt|grep redis
扩展:ss 命令可以用来获取socket 统计信息,它显示的内容和 netstat 类似。但 ss 的优势在于它能够显示更多更详细的有关 TCP 和连接状态的信息,而且比 netstat 更快。当服务器的 socket 连接数量变得非常大时,无论是使用 netstat 命令还是直接 cat /proc/net/tcp,执行速度都会很慢。ss 命令利用到了 TCP 协议栈中tcp_diag。tcp_diag 是一个用于分析统计的模块,可以获得 Linux 内核中第一手的信息,因此 ss 命令的性能会好很多。也就是说 ss命令表示高效,准确。