大数据遇上大型机 结果会如何?

简介:

ZD至顶网服务器频道 06月30日 新闻消息(文/于泽): 进入数据大爆炸时代,企业所面临的局面无疑更复杂了。看着日益累积的各种数据,相信有不少用户都有这样的感觉:明知面前是座金矿,却苦于没有合适的开采方法,只能任机会流逝。

当然,并不是所有用户都在坐等时机,也有不少在尝试的。比如有用户在用分布式平台进行数据的整合、存储、分析、应用,也有用户在用集中式平台进行相关的工作,同样还有用户从分布式平台转向集中式平台。

究竟谁好?各有各的道理,不妨看个具体的案例,从中或许能受到一些启发。

Banca Carige实践心得

Banca Carige Group (Banca Carige) 是意大利的一家银行,距今已经有500多年的历史。其雇佣约6000名员工,有650多个网点,服务120万客户,年营业总额超过8亿欧元。

随着银行业的主战场不断转向移动端,Banca Carige凭借500多年服务客户的经验,果断地提出了改进计划,即通过数据分析更好地了解客户行为,从而达到吸引新客户服务老客户的目的。

最终Banca Carige选择了IBM 大型机作为未来的业务承载平台。至于原因,就像Banca Carige 的ICT治理经理Daniele Cericola所讲,“在银行业中,可用性与安全性对于业务而言至关重要,而大型机的这些性能都经过了实践检验,这一事实使其自然而然成为了我们新计划的平台之选。”

从这个角度看,Banca Carige选择大型机更多还是从安全性、可用性方面出发的结果。由于其之前一直在使用大型机(多年来,Banca Carige一直在采用IBM DB2数据库的IBM CICS Transaction Server上运行包括账户、支付、贷款等在内的核心银行系统,而该数据库位于可运行IBM z/OS的两台IBM zEnterprise EC12 服务器上),给出这样的理由并不意外,那究竟大型机在数据分析方面的表现如何呢,是不是能满足Banca Carige的需求?

“满意。”Daniele Cericola表示,“通过整合,我们所有的分析都是针对大型机的数据仓库进行的,借此我们可获得单一事实来源,而且在为所有新需求开发分布式数据集市时能够避免多余的成本投入和复杂性。”

据悉,Banca Carige已经将原来运行在分布式环境的多个营销数据库和应用迁移至了大型机,并借助运行在Red Hat Enterprise Linux上的IBM Campaign软件开发了新的活动管理数据模型,同时将这些整合至大型机环境中,从而使 DB2 for z/OS 成为分析和大数据唯一的数据储存库。

简单来说,相当于用大型机构建了一个平台,现在这些数据统一在这个平台进行处理。很显然,这个过程所需要的采购成本、电力成本、人力成本在一定范围内并不会像分布式平台那样随着业务量的增加而增加。也就是说,使用大型机做大数据分析并不一定比使用分布式架构成本更高。

虽然短短几段话,但是透露的内容很多。比如鉴于大型机强大的整合能力,最终的TCO并不一定高;再比如支持Linux,使得其解决方案变得更加丰富……

就像Daniele Cericola 在采访中所讲,“在大型机的 Linux 环境中运行我们的移动银行服务,使我们在大型机发展方面又迈进了一步。我们的关键业务价值是,最重要的服务可通过一致稳定的具有高度安全性的平台进行统一管理,而且该平台要能提供一流的可扩展性与性能。”应该说这就是对大型机核心价值的准确概括。

其实类似这样的应用案例还有很多,比如花旗银行、乐购、珠海社保等。

与时俱进的大型机

当然,举了这么一个例子笔者想说的并不是一定要使用大型机进行数据分析,事实上,大型机肯定有其更擅长、更适用的领域。笔者想说的是,在分布式环境大张旗鼓的今天,其实用户还有另外的选择,而且这个选择本身也在发生着变化,这才是最重要的。

说起大型机本身,可能很多人的印象依旧停留在几年甚至十几年前,呆板、贵、封闭。事实上,大型机早已通过实际行动着力改变这一形象。

它不断开放自己,尽管不能说IBM一直在引领潮流,但至少也是在紧跟趋势,比如IBM是 最早的Linux支持者,IBM大型机也很早就支持了Linux,再比如随着OpenStack的兴起,IBM大型机也支持在OpenStack平台上对 其进行统一管理。另外还有很多开源软件,IBM大型机均可支持,包括Docker、Hadoop、Spark、MongoDB、MariaDB等。

它不断提升自己的性能,单台最高支持8000台虚拟机,提供无与伦比的扩展性;在动态多线程技术的帮助下,Linux和Java工作负载运行速度提升30%。论整合能力、性能、安全性、可靠性,绝对无人可及。

它不断以更低的成本来面对用户,当然这个成本不仅是采购成本,因为IT系统的采购成本只占总体拥有成本(TCO)的一小部分,还包括电力、运维、管理等成本,试想能容纳8000台虚拟机的大型机能整合多少台服务器?应该说这个数量是惊人的,由此带来的后期使用成本的节约也是巨大的。

凭借着与时俱进,市场给了大型机、给了IBM积极的反馈。根据IDC发布的2015年第 二季度服务器市场调研报告显示,该季度IBM z13大型机表现强劲,同比增幅近两位数。根据刚刚发布的2016年第一季度IBM财报显示,与去年同期相比,来自z Systems大型主机服务器产品的营收增长了16%(计入汇率变动影响后上涨了21%)。以MIPS(每秒百万指令数)计算的z Systems所交付的计算能力,上升了28%。

记者观察

好多人说大型机不行了,但我们看到的却是大型机的逆势增长,这说明什么?这表明集中式与 分布式之争从来就不是非此即彼的关系,用户关心的只是是否有更好解决问题的方案,这才是他们的根本出发点。因此,就厂商而言,要做的是不断完善方案,并让 用户认识到其中的价值;对于用户而言,则要对各方解决方案有个充分的比较。


原文发布时间为:2016-06-30

本文作者:毕波 

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。



相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
数据挖掘 大数据 关系型数据库
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
36 0
|
3月前
|
机器学习/深度学习 存储 分布式计算
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
|
2月前
|
分布式计算 DataWorks BI
MaxCompute数据问题之运行报错如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 1
|
4月前
|
存储 SQL 大数据
dataCompare大数据对比之异源数据对比
dataCompare大数据对比之异源数据对比
110 0
|
2月前
|
分布式计算 关系型数据库 数据库连接
MaxCompute数据问题之数据迁移如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
35 0
|
2月前
|
分布式计算 Cloud Native MaxCompute
MaxCompute数据问题之没有访问权限如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
11天前
|
数据采集 搜索推荐 大数据
大数据中的人为数据
【4月更文挑战第11天】人为数据,源于人类活动,如在线行为和社交互动,是大数据的关键部分,用于理解人类行为、预测趋势和策略制定。数据具多样性、实时性和动态性,广泛应用于市场营销和社交媒体分析。然而,数据真实性、用户隐私和处理复杂性构成挑战。解决策略包括数据质量控制、采用先进技术、强化数据安全和培养专业人才,以充分发挥其潜力。
14 3

热门文章

最新文章