开发者社区> 游客a74jvhcp7vclg> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

NoSQL(MongoDB,Hbase,Redis)介绍

简介: NoSQL,泛指非关系型的数据库,随着互联网的发展传统的关系型数据库面对持续增长的数据处理起来显得越来越力不从心,此时非关系型数据库应运而生。
+关注继续查看


 NoSQL,泛指非关系型的数据库,随着互联网的发展传统的关系型数据库面对持续增长的数据处理起来显得越来越力不从心,此时非关系型数据库应运而生。

NoSQL数据库

四种类型

 目前大家基本认同将NoSQL数据库分为四大类:键值存储数据库,文档型数据库,列存储数据库和图形数据库,其中每一种类型的数据库都能够解决关系型数据不能解决的问题。在实际应用中,NoSQL数据库的分类界限其实没有那么明显,往往会是多种类型的组合体。

image.png

MongoDB

 MongoDB 是一个高性能,开源,无模式的文档型数据库,开发语言是C++。它在许多场景下可用于替代统的关系型数据库或键/值存储方式.

1.MongoDB特点

   所用语言:C++

   特点:保留了SQL一些友好的特性(查询,索引)。

   使用许可: AGPL(发起者: Apache)

   协议: Custom, binary( BSON)

   Master/slave复制(支持自动错误恢复,使用 sets 复制)

   内建分片机制

   支持 javascript表达式查询

   可在服务器端执行任意的 javascript函数

   update-in-place支持比CouchDB更好

   在数据存储时采用内存到文件映射

   对性能的关注超过对功能的要求

   建议最好打开日志功能(参数 --journal)

   在32位操作系统上,数据库大小限制在约2.5Gb

   空数据库大约占 192Mb

   采用 GridFS存储大数据或元数据(不是真正的文件系统)

2.MongoDB优点

   更高的写负载,MongoDB拥有更高的插入速度。

   处理很大的规模的单表,当数据表太大的时候可以很容易的分割表。

   高可用性,设置M-S不仅方便而且很快,MongoDB还可以快速、安全及自动化的实现节点 (数据中心)故障转移。

   快速的查询,MongoDB支持二维空间索引,比如管道,因此可以快速及精确的从指定位置 获取数据。MongoDB在启动后会将数据库中的数据以文件映射的方式加载到内存中。如果内 存资源相当丰富的话,这将极大地提高数据库的查询速度。

   非结构化数据的爆发增长,增加列在有些情况下可能锁定整个数据库,或者增加负载从而 导致性能下降,由于MongoDB的弱数据结构模式,添加1个新字段不会对旧表格有任何影响, 整个过程会非常快速。

3.MongoDB缺点:

   不支持事务。

   MongoDB占用空间过大 。

   MongoDB没有成熟的维护工具。

4.MongoDB应用场景

   适用于实时的插入、更新与查询的需求,并具备应用程序实时数据存储所需的复制及高度伸缩性;

   非常适合文档化格式的存储及查询;

   高伸缩性的场景:MongoDB 非常适合由数十或者数百台服务器组成的数据库。

   对性能的关注超过对功能的要求。

HBase

 HBase 是 Apache Hadoop 中的一个子项目,属于 bigtable 的开源版本,所实现的语言为Java(故依赖 Java SDK)。HBase 依托于 Hadoop 的 HDFS(分布式文件系统)作为最基本存储基础单元。

1.HBase 特点:

   所用语言: Java

   特点:支持数十亿行X上百万列

   使用许可: Apache

   协议:HTTP/REST (支持 Thrift,见编注4)

   在 BigTable之后建模

   采用分布式架构 Map/reduce

   对实时查询进行优化

   高性能 Thrift网关

   通过在server端扫描及过滤实现对查询操作预判

   支持 XML, Protobuf, 和binary的HTTP

   Cascading, hive, and pig source and sink modules

   基于 Jruby( JIRB)的shell

   对配置改变和较小的升级都会重新回滚

   不会出现单点故障

   堪比MySQL的随机访问性能

2. HBase 优点

   存储容量大,一个表可以容纳上亿行,上百万列;

   可通过版本进行检索,能搜到所需的历史版本数据;

   负载高时,可通过简单的添加机器来实现水平切分扩展,跟Hadoop的无缝集成保障了其数据可靠性(HDFS)和海量数据分析的高性能(MapReduce);

   在第3点的基础上可有效避免单点故障的发生。

3.HBase 缺点

   基于Java语言实现及Hadoop架构意味着其API更适用于Java项目;

   node开发环境下所需依赖项较多、配置麻烦(或不知如何配置,如持久化配置),缺乏文档;

   占用内存很大,且鉴于建立在为批量分析而优化的HDFS上,导致读取性能不高;

   API相比其它 NoSql 的相对笨拙。

4.HBase 适用场景

   bigtable类型的数据存储;

   对数据有版本查询需求;

   应对超大数据量要求扩展简单的需求。

Redis

 Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。目前由VMware主持开发工作。

1.Redis 特点:

   所用语言:C/C++

   特点:运行异常快

   使用许可: BSD

   协议:类 Telnet

   有硬盘存储支持的内存数据库,

   但自2.0版本以后可以将数据交换到硬盘(注意, 2.4以后版本不支持该特性!)

   Master-slave复制(见编注3)

   虽然采用简单数据或以键值索引的哈希表,但也支持复杂操作,例如 ZREVRANGEBYSCORE。

   INCR & co (适合计算极限值或统计数据)

   支持 sets(同时也支持 union/diff/inter)

   支持列表(同时也支持队列;阻塞式 pop操作)

   支持哈希表(带有多个域的对象)

   支持排序 sets(高得分表,适用于范围查询)

   Redis支持事务

   支持将数据设置成过期数据(类似快速缓冲区设计)

   Pub/Sub允许用户实现消息机制

2. Redis 优势

   非常丰富的数据结构;

   Redis提供了事务的功能,可以保证一串 命令的原子性,中间不会被任何操作打断;

   数据存在内存中,读写非常的高速,可以达到10w/s的频率。

3.Redis 缺点

   Redis3.0后才出来官方的集群方案,但仍存在一些架构上的问题;

   持久化功能体验不佳——通过快照方法实现的话,需要每隔一段时间将整个数据库的数据写到磁盘上,代价非常高;而aof方法只追踪变化的数据,类似于mysql的binlog方法,但追加log可能过大,同时所有操作均要重新执行一遍,恢复速度慢;

   由于是内存数据库,所以,单台机器,存储的数据量,跟机器本身的内存大小。虽然redis本身有key过期策略,但是还是需要提前预估和节约内存。如果内存增长过快,需要定期删除数据。

4.Redis 应用场景:

 最佳应用场景:适用于数据变化快且数据库大小可遇见(适合内存容量)的应用程序。

例如:微博、数据分析、实时数据搜集、实时通讯等。


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
分布式NoSQL列存储数据库Hbase(六)
分布式NoSQL列存储数据库Hbase(六)
0 0
全方位认识HBase:一个值得拥有的NoSQL数据库(一)
前言:说起HBase这门技术,在认知上对于稍微接触或使用过它的人来讲,可能只是百千数据库中一个很普通的库,大概就像我对Redis的认知一样:缓存嘛!可对于HBase,我确实是带着某些感情在的。今日突然萌生了一个生趣的想法,想抛开技术的视角,从情感的角度,像写小说一样,写写这位老朋友,这可能会有点滑稽吧,不过我觉得很放松。
914 0
MongoDB、Cassandra 和 HBase 三种 NoSQL 数据库比较
Hadoop 获得了许多大数据应用的信誉,但实际情况是,NoSQL数据库是一直处于更加广泛部署和更广泛的发展中的技术。尽管选择 Hadoop 作为应用存储,相对来说更直接简单。但是,具体采用什么样的 NoSQL 数据库是个值得思考的问题,毕竟,还有超过100种的 NoSQL 数据库。
0 0
BigData NoSQL:ApsaraDB HBase数据存储与分析平台概览
未来,我们将继续紧紧贴合云上用户需求打磨产品,打造核心竞争力,提升易用性,保障系统稳定性,以及引入Serverless特性以进一步降低成本。
1185 0
BigData NoSQL —— ApsaraDB HBase数据存储与分析平台概览
数据库发展有三个明显的趋势:1. 越来越多的数据库会做云原生(CloudNative);2. NoSQL正在解决BigData领域的问题;3. 越来越多的公司或者产品都是融合多个能力。 阿里云HBase经过公共云两年(单独的HBase在阿里内部已经发展快9年)的发展,融合开源Apache HBase、Apache Phoenix、Apache Spark、Apache Solr等开源项目,再加上一系列自研特性,满足 【一体化数据处理平台,提供一站式能力】。
3825 0
HBase进化之从NoSQL到NewSQL,凤凰涅槃成就Phoenix
数据爆炸使得传统单机数据库面临一系列挑战,HBase作为NoSQL数据库,解决了大规模数据实时读写的难题。Phoenix项目在HBase的基础上增加了SQL语言表达,算子原地执行,二级索引,加盐表等特性,进化成为了NewSQL数据库,更好用也更强大。
8176 0
阿里云HBase全新发布X-Pack NoSQL数据库再上新台阶
一、八年双十一,造就国内最大最专业HBase技术团队 阿里巴巴集团早在2010开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储。持续8年的投入,历经8年双十一锻炼。
5012 0
Hadoop原理与技术——Hbase实操
Hadoop原理与技术——Hbase实操
0 0
+关注
游客a74jvhcp7vclg
10余年开发架构经验,同时乐于技术分享!
文章
问答
文章排行榜
最热
最新
相关电子书
更多
玩转HBase和Lindorm 大数据入门和实战
立即下载
第十二届 BigData NoSQL Meetup — 基于hbase的New sql落地实践
立即下载
第十二届 BigData NoSQL Meetup — 快手HBase在千亿级用户特征数据分析中的应用与实践
立即下载