强烈推荐一个大神的人工智能的教程:http://www.captainbed.net/zhanghan
【前言】
当数据达到一定量的时候,数据库会成为整个系统的瓶颈,一般采取的优化策略为读写分离,数据库通过分主库从库从而实现读写分离(写请求操作主库,读请求操作从库);
【解决数据延迟思路】
一、主从同步原理(在此以目前最普及的MySQL为例)
以下是一张经典的MySQL通过binlog实现主从数据同步的原理图:
二、问题是如何产生?
1、从上面原理图中不难发现,主从同步是有一定的延迟,影响延迟大小因素:
(1)延迟的大小取决于从上次同步到现在产生数据量
(2)当前服务器间网络情况
(3)主从服务器本身压力(CPU,内存,IO等)
2、由于数据库服务一般都是在内网当中,而且服务器在购置时都会高一些配置(比实际需要)所以基本上同步都很快,一般为毫秒级;
3、一般的业务场景中毫秒级延迟是可以忽略;
4、有一般就有特殊,有一些特殊情况需要实时毫秒级的时间差也不允许;以下是针对这些特殊情况给出常见的解决方案。
三、数据延迟解决方案:
1、方案一:写程序双写(写主库同时写读库)
2、方案二:读程序查主库
3、方案三:写程序写主库且写缓存(设置一定的失效时间,一般略大于数据库同步最大时延即可),读程序读缓存读从库
四、三种方案优缺点:
1、方案一:双写会消耗一定的性能,实现起来比较简单,高并发写的场景不适用;
2、方案二:读程序会影响主库的性能,实现起来比较简单,高并发读的场景不适用;
3、方案三:大部分情况下读写均多消耗写性能,实现较为复杂,高并发读写都适用(缓存读写非常快);
【总结】
1、实现固然重要,但更为重要的是思路;
2、很多底层的原理与思想是通用的。