NoSQL优势
全称:Not Only SQL 不仅仅是数据库
- 海量的扩展能力
- 读写高性能
- 与关系型数据库(RDBMS)相辅相成
NoSQL产品
- 键值存储型(Key-Value) Redis/Codis
- 列存储型 HBase
Hbase数据分析用的比较多
- 图形(Graph)数据库
Neo4j知识图片用的较多
- 文档型 MongoDB
MongoDB概念
举例:描述人
- 关系型数据库
MongoDB特性
- 可扩展(scalable)
- 高性能(high-performance)
- 开源(open source) NoSQL database
- C++语言编写
- Document-Oriented Storage
- Full Index Support
- Replication & High Availability
- Auto-Sharding
- Rich Querying
- Updates
- Map/Reduce
- GridFS 存储二进制文件
MongoDB稳定性
如何解决数据丢失
- 恢复日志(journal)
MongoDB高可用
核心业务SLASLA 99.99%以上怎么做到的?
MongoDB 副本集(replica set)
- 数据多分冗余
- 跨交换机部署
- 更快的选举方式(参考raft协议)
架构
主从复制+高可用方案
分片
架构
1、对业务方来说没有分库分表的概念 不管数据量多大 对业务方来说都是单库单表 对于关系型数据库来说比如Myql有分库分表的概念 比如1T数据 MongoDB分2个片 每一个片存储500G数据 2、Router可以有很多台 3、分片信息存储在config server中 4、一个分片就是一个副本集(replica set) 5、Router先访问config server获取分片信息,Router再访问分片集(replica set)
表的分片(MongoDB Collection)
分片规则
Sharding Range-based
基于范围分片 用的较多
Mysql B+ Tree本质也是Range-based
Sharding Hash-based
取模分片
Java HashMap是Hash-based 查询速度比较快 不支持范围查询 对于数据库来说 不支持范围查询肯定不合适
1、3个配置节点、3个路由节点(mongos)都是stateless(无状态的即数据都一样) 2、每个分片就是一个replica set(一主两从) 一个分片3台机器 3、cnofig和mongos也可以混合部署在一个sharding上
应用场景
1、位置即GPS或LBS 2、中小公司用它没有问题 量大肯定不行 3、非交易相关的都可以用 a、事务支持的比较弱 b、mongodb 4.0已经支持事务 并且支持跨行事务
可扩展存储
1、最早的操作引擎是MMAP 支持表级锁 也是操作系统自带的一种机制 缺点就是内存利用率不高 2、WireTigger支持行级锁