大数据时代企业CDO的新玩儿法

本文涉及的产品
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

我们正在历经一场由大数据应用的普及引发的变革,即使如蓝色巨人IBM这样的传统巨头也在通过及时转型来应对这场技术浪潮的席卷。IBM认为,大数据与工业时代的蒸汽、电力、石油一样,都是重要的未来资源,企业需要专业人才掌握并利用这种资源,来推动这个时代的进步和发展,就好像当时有人利用石油和电力推动工业时代进步一样。

这时,企业CDO(首席数据官)责无旁贷地将挑起这个重任。CDO所关注的已经不止于企业数据库、数据工具和数据分析工具的选型,而是如何利用这些工具对企业内部、外部行业数据进行分析,并根据分析结果为企业日常运营和未来发展提供战略性指导,成为企企业未来发展方向的参谋官。因此可以捕获、管理和分析大量结构化和非结构化数据的工具对于企业和CDO来说,就是从众多竞争者中脱颖而出的利刃。

近日,IBM 在北京富力万丽酒店举行“IBM数据管理与洞察研讨会”,旨在帮助企业和CDO找到更专业的数据处理和分析服务,以及如何利用IBM数据分析工具PDA与开源技术的结合,提高数据存储、整合与治理以及最终的分析的能力,来定义大数据时代行业数据的新玩儿法。

PDA(Power Data System for Analytics)是IBM针对大数据仓库推出的一体机,具于快速、简单、可扩展和智能等特点。其专门用于在数据仓库和OLAP系统中处理结构化数据,来解决企业传统数据仓库基础架构复杂、维护困难等弊端。

OLAP系统和OLTP的不同之处在于OLAP着重于分析型的系统,呈现出以涉及数据量大、多表连接等特征。目前数据仓库和OLAP市场上的主流技术架构为Share Nothing+MPV,具体来说就是将数据按照一定的规则分布在多个磁盘上面,也就是我们常说的数据磁盘,相较OLTP系统将所有数据都存放于一块盘上的方式,使用Share Nothing架构会使余额表的数据均匀分布在所有磁盘,后续对这张余额表进行的所有操作也都是所有磁盘一起运行,使系统性能得到显著提升。由于采用Share Nothing架构,使PDA拥有比传统架构快10—100位的数据处理速度。

硬件加速卡是PAD的技术核心,它由两块8核、128G的磁盘组成,整个机器可用数据容量192TB。硬件加构卡主要有以下三个功能:

  • 压缩和解压——数据入库进行压缩和解压且不占用计算节点,而是完成在压缩和解压消耗的CPU两个卡上面。
  • 投影——我们可以把它简单理解为把不需要的列去掉。PDA数据流入内存前,会先经过一道流处理将不需要的字段会被全部砍掉,很大程度上减少内存压力。
  • 过滤——这是把不需要的行去掉。经过投影和过滤功能处理过以后,数据从磁盘往内存搬的时候,只会涉及到最后有用的数据,使系统性能得到显著提升。

PDA可以与Datastage等IBM内部产品实现无缝集成。今年PDA新加入了Fluid Query,它可以实现客户在应用端发起查询以后,无论这个查询涉及几张表,是在PDA平台里还是在Hadoop平台里,都可以通过Fluid Query功能自动去找到这张表对应的平台,然后去做相应的查询和操作业务。

IBM PDA通过磁盘、计算节点和管理节点来做到HA的三重保障。 另外,它支持很多第三方备份软件,可以实现全量备分、插量备份、累计备分三种模式,最大程度保证数据安全。

最后要说明的是,PDA相对于市面上其他数据仓库一体机来讲是,需要企业投入的管理力量是最小的,体现几点。第一,PDA没有索、主件、外件和分区,也基本不需要调优,因为它的调优在模型设计阶段已经体现。第二,不需要存储管理。PDA的设计中不存在传统架构中类似于表空间的储存管理。第三,本身具有容错机制。一旦发生故障,只需要及时将出现问题的部分及时更换,不会引起某个机器瘫痪,企业也就不用再雇佣专职的数据管理员。

PDA走进中国大陆地区不过三年时间,却已经拥有电信、证券、银行等传统行业在内的40余位客户,通过提供高性能、海量数据存储和海量数据处理、降低运维成本、对业务数据进行更加深层次的分析研究等方面的解决方案,为企业带来价值。


本文作者:佚名

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
SQL 存储 监控
大数据Flume企业开发实战
大数据Flume企业开发实战
145 0
|
3月前
|
存储 供应链 数据可视化
Java 大视界 -- 基于 Java 的大数据可视化在企业供应链风险预警与决策支持中的应用(204)
本篇文章探讨了基于 Java 的大数据可视化技术在企业供应链风险预警与决策支持中的深度应用。文章系统介绍了从数据采集、存储、处理到可视化呈现的完整技术方案,结合供应链风险预警与决策支持的实际案例,展示了 Java 大数据技术如何助力企业实现高效、智能的供应链管理。
|
6月前
|
数据采集 人工智能 大数据
大数据+商业智能=精准决策,企业的秘密武器
大数据+商业智能=精准决策,企业的秘密武器
217 28
|
7月前
|
机器学习/深度学习 人工智能 搜索推荐
用大数据重塑客户关系管理:聪明企业的秘密武器
用大数据重塑客户关系管理:聪明企业的秘密武器
181 9
|
7月前
|
机器学习/深度学习 人工智能 算法
解锁政策红利:大数据时代的企业与个人发展新契机
在大数据与机器学习时代,政策解读、预测分析和个性化匹配成为挖掘发展新动能的重要工具。无论是企业还是个人,都能借助先进技术轻松理解复杂政策,把握趋势先机。文章探讨了自由职业者、创业者及企业员工如何通过政策支持实现协同发展,并介绍了“政策宝”这一智慧助手,助力用户发现和利用政策红利,抓住机遇实现目标。探索政策宝库,开启发展新征程!
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
621 2
|
存储 机器学习/深度学习 大数据
参与开源大数据Workshop·杭州站,共探企业湖仓演进实践
Apache Flink 诚邀您参加 7 月 27 日在杭州举办的阿里云开源大数据 Workshop,了解流式湖仓、湖仓一体架构的最近演进方向,共探企业云上湖仓实践案例。
300 12
参与开源大数据Workshop·杭州站,共探企业湖仓演进实践
|
Oracle 大数据 数据挖掘
企业内训|大数据产品运营实战培训-某电信运营商大数据产品研发中心
本课程是TsingtaoAI专为某电信运营商的大数据产品研发中心的产品支撑组设计,旨在深入探讨大数据在电信运营商领域的应用与运营策略。通过密集的培训,从数据的本质与价值出发,系统解析大数据工具和技术的最新进展,深入剖析行业内外的实践案例。课程涵盖如何理解和评估数据、如何有效运用大数据技术、以及如何在不同业务场景中实现数据的价值转化。
218 0
|
存储 监控 数据挖掘
云上大数据分析平台:赋能企业决策,挖掘数据金矿
5.3 场景化 针对不同行业和领域的需求特点,云上大数据分析平台将推出更多场景化的解决方案。这些解决方案将结合行业特点和业务场景进行
685 7
|
存储 分布式计算 数据可视化
ERP系统中的大数据分析与处理:驱动企业智能决策
【7月更文挑战第29天】 ERP系统中的大数据分析与处理:驱动企业智能决策
1002 0