数据仓库需要的不是退出历史舞台

简介: 本文讲的是数据仓库需要的不是退出历史舞台【IT168 评论】国内最受关注的数据库技术盛会——2017第八届中国数据库技术大会(DTCC2017)于2017年5月11-13日如约而至。本届大会以“数据驱动?价值发现”为主题,汇集来自互联网、电子商务、金融、电信、政府、行业协会等20多个领域的120多位技术专家,共同探讨Oracle、MySQL、NoSQL、云端数据库、智能数据平台、区块链、数据可视化、深度学习等领域的前瞻性热点话题与技术。

本文讲的是数据仓库需要的不是退出历史舞台【IT168 评论】国内最受关注的数据库技术盛会——2017第八届中国数据库技术大会(DTCC2017)于2017年5月11-13日如约而至。本届大会以“数据驱动?价值发现”为主题,汇集来自互联网、电子商务、金融、电信、政府、行业协会等20多个领域的120多位技术专家,共同探讨Oracle、MySQL、NoSQL、云端数据库、智能数据平台、区块链、数据可视化、深度学习等领域的前瞻性热点话题与技术。  

数据仓库需要的不是退出历史舞台

  (更多大会精彩:http://tech.it168.com/topic/2017/5-10/DTCC2017/)

在大会的分会场上,来自酷客数据的联合创始人兼CEO简丽荣来了《云端数据仓库HashData的设计与实现》的精彩分享。

谈到数据仓库,有些人认为在大数据时代,已经是一种黄昏技术,传统的数据仓库假设主题是较少变化的,其应对变化的方式是对数据源到前端展现的整个流程中的每个部分进行修改,然后重新加载数据,甚至重新计算数据,导致其适应变化的周期较长,但这种模式比较适合对数据质量和查询性能要求较高、而不太计较预处理代价的场合。

而在简丽荣看来,数据仓库需要的不是退出历史舞台,而是根本性的改变。酷客数据正在做的就是这件事。据了解,酷客数据由Apache HAWQ创始团队于2016年成立,专注于SQL-on-Cloud云端数据仓库服务,核心团队由来自Pivotal,Teradata,IBM,Yahoo!等公司资深的分布式数据库、云计算和Hadoop专家组成。

随着信息技术的迅速发展,各行各业正产生和积累爆炸式的数据。但是,尽管近年来大数据处理相关的工具和产品不断涌现,传统部署模式下的大数据分析软硬件前期投入巨大、实施周期漫长、运维复杂,加上艰难的IT资源规划等原因,导致企业进行大数据分析的门槛依然很高。

简丽荣认为,云计算的快速发展,特别是云端数据的爆炸式增长,使得数据仓库上云成为大势所趋;同时,云计算平台也为企业解决传统数据仓库面临的挑战提供了坚实的基础。不仅云计算的规模经济和按需收费的模式大大降低了企业的前期投入成本,同时,计算、存储和网络资源的API化使得软硬件近一步融合,让数据仓库系统的自动化运维甚至是智能化运维成为可能。

酷客数据的核心产品——HashData数据仓库,是一个高性能、完全托管的PB级数据仓库服务,让企业用户能够更轻松地分析海量数据。通过使用HashData,企业用户无需购买、配置和管理庞大的服务器集群,按使用量付费,没有任何前期投入,使得数据存储和分析的成本不到传统解决方案的十分之一。另外,HashData数据仓库兼容标准的JDBC和ODBC,无缝集成企业内部已有的ETL和BI工具。这意味着HashData数据仓库使用起来跟部署在企业内部数据中心的传统数据仓库一样自然方便。

可以说,HashData提供了丰富的分析功能,并通过灵活、高速的数据连接器,实现与云平台其他数据服务的互联互通,有效缓解客户面临的数据孤岛问题。另外,拥抱开源也是HashData的一个特点,消除数据绑架的风险。

值得一提的是,HashData数据仓库可以按需启动数据仓库集群,不需要DBA介入,在线升级和扩缩容,支持独立的元数据服务,并且对象存储服务提供几乎无限的存储容量,以及数据多版本控制。根据不同的工作负载启动不同配置的集群,同时,开发、测试和生产环境能够完全一致。

随着企业将越来越多的应用部署在云平台上面,产生和积累了爆炸性增长的数据,云端大数据分析势在必行,而与时具进的数据仓库解决方案则是降低大数据分析门槛的重中之重。

原文发布时间为:2017-05-13

本文作者:张存

本文来自云栖社区合作伙伴IT168,了解相关信息可以关注IT168

原文标题:数据仓库需要的不是退出历史舞台

目录
相关文章
|
存储 SQL 消息中间件
大数据生态圈常用组件(一):数据库、查询引擎、ETL工具、调度工具等
大数据生态圈常用组件(一):数据库、查询引擎、ETL工具、调度工具等
|
1月前
|
存储 数据采集 Apache
众安保险 CDP 平台:借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛,人群圈选提速4倍
随着业务在金融、保险和商城领域的不断扩展,众安保险建设 CDP 平台以提供自动化营销数据支持。早期 CDP 平台依赖于 Spark + Impala + Hbase + Nebula 复杂的技术组合,这不仅导致数据分析形成数据孤岛,还带来高昂的管理及维护成本。为解决该问题,众安保险引入 Apache Doris,替换了早期复杂的技术组合,不仅降低了系统的复杂性,打破了数据孤岛,更提升了数据处理的效率。
众安保险 CDP 平台:借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛,人群圈选提速4倍
|
7月前
|
分布式计算 安全 Hadoop
大数据Hadoop集群运行程序
大数据Hadoop集群运行程序
69 1
|
12月前
|
存储 NoSQL 关系型数据库
分库分表,可能真的要退出历史舞台了!
分库分表,可能真的要退出历史舞台了!
|
数据库 数据安全/隐私保护
Teradata 宣布退出中国,OushuDB 成为更好选择
Teradata 宣布退出中国,OushuDB 成为更好选择
58 0
|
存储 缓存 分布式计算
持续定义 Saas 模式云数据仓库+实时分析 | 学习笔记(二)
快速学习持续定义 Saas 模式云数据仓库+实时分析
214 0
持续定义 Saas 模式云数据仓库+实时分析 | 学习笔记(二)
|
存储 人工智能 分布式计算
持续定义 Saas 模式云数据仓库+实时分析 | 学习笔记(一)
快速学习持续定义 Saas 模式云数据仓库+实时分析
137 0
持续定义 Saas 模式云数据仓库+实时分析 | 学习笔记(一)
|
存储 分布式计算 NoSQL
分析服务一体化新能理解读| 学习笔记
快速学习分析服务一体化新能理解读
73 0
分析服务一体化新能理解读| 学习笔记
|
存储 消息中间件 分布式计算
持续定义 Saas 模式云数据仓库 +实时分析 | 学习笔记
快速学习持续定义 Saas 模式云数据仓库 +实时分析,介绍了持续定义 Saas 模式云数据仓库 +实时分析系统机制, 以及在实际应用过程中如何使用。
152 0
持续定义 Saas 模式云数据仓库 +实时分析 | 学习笔记
|
存储 消息中间件 SQL
看场景、重实操,实时数仓不是“纸上谈兵”
Hologres产品负责人合一谈谈他眼中的实时数仓!
1821 4
看场景、重实操,实时数仓不是“纸上谈兵”