大数据时代企业CDO的新玩儿法

简介:

我们正在历经一场由大数据应用的普及引发的变革,即使如蓝色巨人IBM这样的传统巨头也在通过及时转型来应对这场技术浪潮的席卷。IBM认为,大数据与工业时代的蒸汽、电力、石油一样,都是重要的未来资源,企业需要专业人才掌握并利用这种资源,来推动这个时代的进步和发展,就好像当时有人利用石油和电力推动工业时代进步一样。

这时,企业CDO(首席数据官)责无旁贷地将挑起这个重任。CDO所关注的已经不止于企业数据库、数据工具和数据分析工具的选型,而是如何利用这些工具对企业内部、外部行业数据进行分析,并根据分析结果为企业日常运营和未来发展提供战略性指导,成为企企业未来发展方向的参谋官。因此可以捕获、管理和分析大量结构化和非结构化数据的工具对于企业和CDO来说,就是从众多竞争者中脱颖而出的利刃。

近日,IBM 在北京富力万丽酒店举行“IBM数据管理与洞察研讨会”,旨在帮助企业和CDO找到更专业的数据处理和分析服务,以及如何利用IBM数据分析工具PDA与开源技术的结合,提高数据存储、整合与治理以及最终的分析的能力,来定义大数据时代行业数据的新玩儿法。

PDA(Power Data System for Analytics)是IBM针对大数据仓库推出的一体机,具于快速、简单、可扩展和智能等特点。其专门用于在数据仓库和OLAP系统中处理结构化数据,来解决企业传统数据仓库基础架构复杂、维护困难等弊端。

OLAP系统和OLTP的不同之处在于OLAP着重于分析型的系统,呈现出以涉及数据量大、多表连接等特征。目前数据仓库和OLAP市场上的主流技术架构为Share Nothing+MPV,具体来说就是将数据按照一定的规则分布在多个磁盘上面,也就是我们常说的数据磁盘,相较OLTP系统将所有数据都存放于一块盘上的方式,使用Share Nothing架构会使余额表的数据均匀分布在所有磁盘,后续对这张余额表进行的所有操作也都是所有磁盘一起运行,使系统性能得到显著提升。由于采用Share Nothing架构,使PDA拥有比传统架构快10—100位的数据处理速度。

硬件加速卡是PAD的技术核心,它由两块8核、128G的磁盘组成,整个机器可用数据容量192TB。硬件加构卡主要有以下三个功能:

  • 压缩和解压——数据入库进行压缩和解压且不占用计算节点,而是完成在压缩和解压消耗的CPU两个卡上面。
  • 投影——我们可以把它简单理解为把不需要的列去掉。PDA数据流入内存前,会先经过一道流处理将不需要的字段会被全部砍掉,很大程度上减少内存压力。
  • 过滤——这是把不需要的行去掉。经过投影和过滤功能处理过以后,数据从磁盘往内存搬的时候,只会涉及到最后有用的数据,使系统性能得到显著提升。

PDA可以与Datastage等IBM内部产品实现无缝集成。今年PDA新加入了Fluid Query,它可以实现客户在应用端发起查询以后,无论这个查询涉及几张表,是在PDA平台里还是在Hadoop平台里,都可以通过Fluid Query功能自动去找到这张表对应的平台,然后去做相应的查询和操作业务。

IBM PDA通过磁盘、计算节点和管理节点来做到HA的三重保障。 另外,它支持很多第三方备份软件,可以实现全量备分、插量备份、累计备分三种模式,最大程度保证数据安全。

最后要说明的是,PDA相对于市面上其他数据仓库一体机来讲是,需要企业投入的管理力量是最小的,体现几点。第一,PDA没有索、主件、外件和分区,也基本不需要调优,因为它的调优在模型设计阶段已经体现。第二,不需要存储管理。PDA的设计中不存在传统架构中类似于表空间的储存管理。第三,本身具有容错机制。一旦发生故障,只需要及时将出现问题的部分及时更换,不会引起某个机器瘫痪,企业也就不用再雇佣专职的数据管理员。

PDA走进中国大陆地区不过三年时间,却已经拥有电信、证券、银行等传统行业在内的40余位客户,通过提供高性能、海量数据存储和海量数据处理、降低运维成本、对业务数据进行更加深层次的分析研究等方面的解决方案,为企业带来价值。


本文作者:佚名

来源:51CTO

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
7月前
|
SQL 存储 监控
大数据Flume企业开发实战
大数据Flume企业开发实战
36 0
|
14天前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。
|
4月前
|
分布式计算 大数据 数据处理
大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
35 0
|
4月前
|
存储 人工智能 安全
AI大数据分析对企业安全隐私的保护非常重要
AI大数据分析在提供企业发展和决策支持的同时,也涉及到大量的企业数据和用户隐私信息。因此,保护企业安全隐私是非常重要的。
|
7月前
|
机器学习/深度学习 大数据 数据挖掘
大数据及其影响:企业如何充分利用它
大数据及其影响:企业如何充分利用它
|
11月前
|
SQL 存储 运维
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(中)
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(中)
108 0
|
11月前
|
运维 关系型数据库 MySQL
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(下)
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(下)
|
分布式计算 MaxCompute
《帮助企业做好MaxCompute成本优化的实践》电子版地址
帮助企业做好MaxCompute成本优化的实践
70 0
《帮助企业做好MaxCompute成本优化的实践》电子版地址
|
大数据 数据挖掘 数据安全/隐私保护
打造大数据硬核组织丨突破瓶颈,为企业变现赋能
竞争激烈、竞价恶点、同行恶点 …… 行业经营环境恶劣、广泛流量难转化 …… 客户群体分散、营销成本极高
|
大数据 数据挖掘 数据建模
运营商大数据精准获客是怎么做到的?企业如何以低成本获取精准客户?
运营商拥有强大的云计算大数据中心,可以通过建立数据模型对任何网站,网页,网址,手机app,400电话,固话,关键词,短信号码等平台进行实时精准数据分析,通过用户综合行为,和用户偏好等综合用户信息等,对目标客户群体进行精准抓取和获取,同时还可以筛选如地区,性别,年龄,职业,访问次数,访问时长,通话次数,通话时长等维度,对目标客户群体更加精准定位。
运营商大数据精准获客是怎么做到的?企业如何以低成本获取精准客户?

热门文章

最新文章