跟我一起数据挖掘(10)——HP Vertica

简介:

考虑到企业数据仓库的重要战略意义(EDWs)和每年投入的巨额维护和扩展费用,如何容易地访问这些大量信息资产是非常迫切的需求。然而,许多EDWs成为自己成功的受害者。随着时间的推移,用户获取新问题答案的需要导致EDWs包含的数据量和复杂数据类型发生迅速增长,同时也带来更多的并发和复杂分析的压力。如果企业级数据仓库变得无法应付这种变化,或者服务水平协议(SLA)不能满足用户的要求,企业则往往不得不进行昂贵的数据库重新设计或硬件平台迁移扩容项目,这往往需要持续好多个月以及带来大量成本损失。即使如此新的架构也往往由于数据量增加得太快(目前已经有大量的客户从TB向PB级别扩展),而导致系统不得不进行更多的优化,这些优化需要占用大量的磁盘存储,带来了存储浪费和I/O瓶颈的问题。因此如何解决在以往EDWs架构保持不变的状况下来满足新的实时性分析应用的需要成为技术创新的重要领域。Vertica正是这一领域的积极创新先锋。

下面这篇文章对vertica和inforbright进行了对比:

http://blog.csdn.net/zyz511919766/article/details/27682709

下面是关于建库和建表的示例:

http://www.cnblogs.com/jyzhao/p/3779045.html

关于管理部分可以参考:

http://www.cnblogs.com/jyzhao/p/3798363.html

实测的过亿条数据,在单表查询的情况下,性能非常理想,推荐一下!

相关文章
【数据挖掘】数据挖掘简介 ( 数据挖掘引入 | KDD 流程 | 数据源要求 | 技术特点 )
【数据挖掘】数据挖掘简介 ( 数据挖掘引入 | KDD 流程 | 数据源要求 | 技术特点 )
488 0
【数据挖掘】数据挖掘简介 ( 数据挖掘引入 | KDD 流程 | 数据源要求 | 技术特点 )
工具推荐 | 分析大数据最需要的Top 10数据挖掘工具
本文讲的是工具推荐 | 分析大数据最需要的Top 10数据挖掘工具,首先,我们要了解什么是数据挖掘?官方提供的定义如下:数据挖掘又称为资料探勘、数据采矿。
9048 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等