GreenPlum的那些事《一》——GreenPlum数据库介绍-阿里云开发者社区

开发者社区> 神垕> 正文

GreenPlum的那些事《一》——GreenPlum数据库介绍

简介: GreenPlum数据库介绍
+关注继续查看

1. 数据存储

行式数据库是按照行存储的,行存储就是各行放入连续的物理位置,就行我们平时写字一样,一行一行的写,读取的时候也是一行一行的读取。像SQL server,Oracle,mysql等传统的关系型数据库都属于行式数据库范畴。
列式数据库是按照列存储的,列存储是把多行数据的每一列按照列存储在磁盘,就像一把数据写入excel表格中,每次按照列读取数据,像Vertica,GreenPlum,HBase(HBase其实不是真正的列式数据库,是按照列簇存储的)。
列存储和行存储对比

2. GreenPlum架构

massively parallel processing 简称MPP,即无共享、大规模并行处理。
MPP架构

MPP架构有如下特点:

  • Share Nothing节点之间数据不共享,只有通过网络连接实现的协同,每个节点有独立的存储和内存。
  • 数据根据某种规则(如Hash)散布到各个节点
  • 计算任务也是会发布到各个节点并行执行,最后再将结果聚合到整体返回
  • 用户使用时会看做整体

Greenplum 数据库软件将数据平均分布到系统的所有节点服务器上,所以节点存储每张表或表分区的部分行,所有数据加载和查询都是自动在各个节点服务器上并行运行,并且该架构支持扩展到上万个节点。

压缩数据
根据数据类型、基数自动进行数据压缩,支持多种压缩算法,压缩比通常可达10:1左右,支持直接访问编码数据的数据值,大大节省在数据查询期间的CPU开销,获得相应有效 I/O 性能提升。

所以在此说明下,建表的时候字段类型一定要选择合适的类型,比如数字类型就选数字类型,不要选字符类型,使用的时候在转换,时间类型也一样。

以上简单的介绍了GPDB的一些特性,在使用中优化就要依据这些特性来的。后期会逐渐介绍GPDB的使用和优化。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
MySQL默认数据库介绍
MySQL默认数据库介绍   大家在学习MySQL时,安装后都会发现里边已经自带了几个默认的数据库,我装的MySQL5.5里边自带六个数据库      网上查了一些资料对这几个数据库的功能做一下学习。
2406 0
Android Studio 通过一个登录功能介绍SQLite数据库的使用
前言:         SQLite简介:是一款轻型的数据库,是遵守ACID的关系型数据库管理系统,它包含在一个相对小的C库中。它是D.RichardHipp建立的公有领域项目。它的设计目标是嵌入式的,而且目前已经在很多嵌入式产品中使用了它,它占用资源非常的低,在嵌入式设备中,可能只需要几百K的内存就够了。
4156 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
4479 0
PostgreSQL数据库介绍PPT
附件中是一篇介绍PostgreSQL数据库的PPT。 PostgreSQL数据库介绍.zip (386.58 KB) 下载次数: 3092011-04-15 19:23 ,此篇文章也可见我的blog: http://blog.osdba.net/?post=48    PostgreSQL数据库是一款非常优秀的开源数据库,有丰富的的功能,在功能上是全面超越MySQL的一个开源数据库,在性能上也不比MysQL差,同时PostgreSQL与Oracle一样,都是进程架构,能更好的发挥出多CPU的性能。
1296 0
阿里云数据库Greenplum版发布啦
经过阿里云ApsaraDB小伙伴们几个月的不懈努力,Greenplum 终于上云了。 云数据库Greenplum版(ApsaraDB for Greenplum)是基于Greenplum开源数据库项目的MPP大规模并行处理数据仓库产品,提供全面的SQL支持(包括符合SQL2008标准的OLAP
23906 0
数据库中跨平台迁移方法介绍
  一、迁移方法介绍:   exp/imp:   这也算是最常用最简单的方法了,一般是基于应用的owner级做导出导入。   操作方法为:在新库建立好owner和表空间,停老库的应用,在老库做exp user/pwd owner=XXX file=exp_xxx.
775 0
+关注
神垕
实践、研究Hive、Spark、Vertica
59
文章
4
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载