带你读《2022技术人的百宝黑皮书》——数据库存储选型经验总结(4)

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 MongoDB,通用型 2核4GB
简介: 带你读《2022技术人的百宝黑皮书》——数据库存储选型经验总结(4)

带你读《2022技术人的百宝黑皮书》——数据库存储选型经验总结(3)https://developer.aliyun.com/article/1340014?groupCode=taobaotech


列式 NoSql(代表 —-HBase)

 

列式 NoSql 和关系型数据库一样都有主键的概念,区别在于关系型数据库是按照行组织的数据,数据字段即使没有值同样占空间,列式存储完全是另一种方式,它是按列进行数据组织的,好处在于:

 

  1. 查询时只有指定的列会被读取,不会读取所有列
  2. 存储上节约空间,空值不会被存储,一列中有时候会有很多重复数据(尤其是枚举数据,性别、状态等字段), 这类数据可压缩
  3. 列数据被组织到一起,一次磁盘 IO 可以将一列数据一次性读取到内存中

 

大数据时代最具代表性的技术之一 HBase 就是列式 NoSQL 的产品实现,其优点主要是:

 

  1. 海量数据存储,PB 级别数据随便存,底层基于 HDFS(Hadoop 文件系统),数据持久化
  2. 读写性能好,只要没有滥用造成数据热点,读写基本没任何问题
  3. 横向扩展在关系型数据库及非关系型数据库中都是最方便的之一,只需要添加新机器就可以实现数据容量的线性增长,且可用在廉价服务器上,节省成本
  4. 可存储结构化或者半结构化的数据
  5. 本身没有单点故障,可用性高
  6. 列数理论上无限制,HBase 本身只对列族数量有要求,建议 1~3

 

缺点主要表现在:

 

  1. HBase Hadoop 生态的一部分,因此它本身是一款比较重的产品,依赖很多 Hadoop 组件,数据规模不大没必要用,运维还是有点复杂的。
  2. 不支持分页查询,因为统计不了数据总数。
  3. KV 式存储,条件查询很弱,HBaseScan 扫描一批数据的情况下还是提供了前缀匹配这种 API 的,条件查询除非定义多个 RowKey 做数据冗余。

 

因此 HBase 比较适用于 KV 型存储且未来无法预估数据增长量的场景,另外 HBase 使用还是需要一定的经验,主要体现在 RowKey 的设计上。

 

文档型 NoSql(代表 —-MongoDB)

 

文档型 NoSql 指的是将半结构化数据存储为文档的一种 NoSql,文档型 NoSql 通常以 JSON 或者 XML 格式存储数据,因此文档型 NoSql 是没有 Schema 的,由于没有 Schema 的特性,我们可以随意地存储与读取数据,因此文档型 NoSql 的出现是解决关系型数据库表结构扩展不方便的问题的。

 

 

 

MongoDB 是文档型 NoSql 的代表产品,同时也是所有 NoSql 产品中的明星产品之一,它的很多概念与关系数据库类似,因此,对于 MongDB,我们只需要理解成一个 Free-Schema 的关系型数据库就好了,其优点主要是:

 

  1. 没有预定义的字段,扩展字段容易
  2. 相较于关系型数据库,读写性能优越,命中二级索引的查询不会比关系型数据库慢,对于非索引字段的查询则是全面胜出

 

缺点在于:

 

  1. 不支持事务操作,虽然 Mongodb4.0 之后宣称支持事务,但是效果待观测
  2. 多表之间的关联查询不支持(虽然有嵌入文档的方式),join 查询还是需要多次操作
  3. 空间占用较大,这个是 MongDB 的设计问题,空间预分配机制 + 删除数据后空间不释放,只有用 db.repair Database () 去修复才能释放
  4. 目前没发现 MongoDB 有关系型数据库例如 MySqlNavicat 这种成熟的运维工具

 

总而言之,MongDB 的使用场景很大程度上可以对标关系型数据库,但是比较适合处理那些没有 join、没有强一致性要求且表 Schema 会常变化的数据。

 

通过以上讨论分析我们心中已经有了一个基本的选型框架指导,实际上在数据库选型时回答自己两个核心问题就好了:

 

  1. 什么时候选用关系型数据库,什么时候选用非关系型数据库
  2. 选用非关系型数据库的话,使用哪种非关系型数据库

 

带你读《2022技术人的百宝黑皮书》——数据库存储选型经验总结(5)https://developer.aliyun.com/article/1340012?groupCode=taobaotech

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
7天前
|
前端开发 Java Go
新一代数据库技术的崛起与应用前景
本文探讨了新一代数据库技术在不同领域的崛起和应用前景。通过对前端、后端、Java、Python、C、PHP、Go等多种类型的技术进行分析,我们揭示了新一代数据库技术的优势和特点,并展望了其在未来的发展趋势。本文旨在为读者全面了解新一代数据库技术提供参考和指导。
|
7天前
|
SQL 存储 NoSQL
SQL与NoSQL数据库的选择:技术与场景驱动下的决策
【6月更文挑战第16天】**SQL vs NoSQL数据库:技术与应用场景比较。SQL数据库以其关系模型、ACID特性、灵活查询及事务处理见长,适合结构化数据和强一致性场景。NoSQL则以数据模型灵活性、高可扩展性、高性能及低成本著称,适合大数据、高并发和快速迭代的需求。选择应基于业务需求、数据特性、系统架构和成本。**
|
2天前
|
SQL Java 数据库连接
【MyBatis】深入解析MyBatis:高效操作数据库技术详解
【MyBatis】深入解析MyBatis:高效操作数据库技术详解
17 0
|
3天前
|
存储 Java Apache
杨校老师课堂之用户登录时如何进行密码加密存储到数据库
杨校老师课堂之用户登录时如何进行密码加密存储到数据库
8 0
|
8天前
|
监控 安全 关系型数据库
精通MySQL:数据库核心技术与应用实践
h3> 一、引言 MySQL作为开源关系型数据库管理系统的佼佼者,凭借其出色的性能、灵活性和稳定性,成为许多企业和开发者的首选
|
9天前
|
存储 人工智能 NoSQL
探索数据库技术的奥秘:从基础架构到前沿应用
一、引言 在数字化时代,数据库技术作为信息管理的基石,已经渗透到我们生活的方方面面
|
9天前
|
存储 SQL NoSQL
探索数据库技术的奥秘:从核心原理到行业应用
一、引言 数据库技术是现代信息科技的核心组成部分,它为我们提供了一种高效、可靠的方式来存储、检索和管理数据
|
9天前
|
存储 人工智能 NoSQL
探索数据库技术的奥秘:原理、应用与前沿发展
一、引言 数据库技术作为现代信息技术的核心支柱之一,已经深入到各个行业与领域,成为数据处理与存储的不可或缺的工具
|
9天前
|
存储 SQL NoSQL
探索数据库技术的奥秘:原理、应用与前沿进展
一、引言 数据库技术作为现代信息技术的核心组成部分,承载着数据存储、检索、管理和分析的重要任务
|
9天前
|
SQL 存储 数据处理
探索数据库技术的奥秘:原理、应用与未来发展
一、引言 在当今数字化时代,数据库技术已成为支撑各种应用系统和业务运行的关键基础设施

热门文章

最新文章