拥抱开源!解析IBM Power8与Hadoop的不解之缘

简介:

大数据分析不仅改变了企业开展业务的地点和方式,而且还在改变业务决策流程的速度与范围。企业希望通过投资大数据分析技术来增强客户体验、提高客户忠诚度、开创全新的创收机会。他们需要部署经济高效的、高性能的、可靠敏捷的IT基础架构,以便利用特殊的数据资产来产生最佳业务成效。

与x86架构相比,客户能够通过数量更少但却更加可靠的Power8服务器来降低总体拥有成本(TCO)。更重要的是,这些客户还将能够受益于不断发展壮大的IBM合作伙伴开源生态圈(OpenPOWER基金会)及一致性附加处理器接口(CAPI)等颠覆性创新技术所交付的卓越价值。

IBM以开放的态度拥抱开源

IBM一直将开源合作视为创新驱动力,倡导、参与和支持Linux和开源软件,并将开源技术融入满足企业客户需求的各种方案中。IBM是大数据市场中规模最大的供应商。近10年来,他们投资超过150亿美元来开发全套的大数据解决方案。Power对开源的支持,也使今天的开发者更容易利用开源技术开发大数据分析应用。

IBM还在Power Systems服务器上提供最新版本的Ubuntu服务器、Ubuntu OpenStack和Canonical公司的JujuCloud Orchestration工具。基于Power 的Ubuntu为现有的Linux应用向Power移植提供简便的通道,用以轻松实现云部署,建成新的大数据和移动软件应用,并帮助提升现有云端应用的性能。基于Power 的Ubuntu对已经全线支持红帽和SUSE Linux操作系统的Power Systems产品线提供了良好的补充。

此外,IBM通过OpenPOWER基金会使POWER8用于开放式的开发。OpenPOWER基金会是一个多家业内公司围绕着POWER8平台成立的联合组织,致力于加快数据中心的创新及基于POWER8架构的系统设计变革。OpenPOWER基金会中不仅包括家喻户晓的科技巨头(如Google、Samsung、NVIDIA、Micron及Mellanox),还包括浪潮、中兴等国内企业。OpenPOWER基金会提供Power软硬件用于开放型开发,以及Power知识产权许可。Power8的开放将为大数据分析、移动、社交催生更好的基础架构平台。

Power8让Hadoop应用性能提升3.65倍

Hadoop是一个能够对大数据进行分布式存储和处理的软件框架,它具有高可靠性、高扩展、容错、高效、低成本的特点,一度广受互联网公司青睐,企业级用户也越来越多的接受Hadoop。但凡事都有两面性,佘晖表示,星环科技在做Hadoop应用和技术的时候,发现Hadoop是非常耗费计算资源的,用户希望获得更优秀的性能。

通过测试发现,IBM Power8产品非常适合Hadoop应用。据星环科技提供资料显示,在与IBM合作针对Hadoop的性能优化和调优后,IBM做了很多改进,与x86处理器相比,POWER8实现了3.65倍的运行速度提升。除了性能外,POWER在中国很多的行业、在企业级市场有着深厚的积淀和客户群,产品也非常适合这些客户,这也是星环科技选择POWER的原因。

大数据助力空气质量预测

拥有强大集群能力的POWER服务器在应用方面有何过人之处呢?帮助北京预测空气质量就是其中之一。IBM在去年就与北京市政府签署协议,利用先进的天气预报和云计算技术,协助中国防治大气污染。

据了解,北京市政府是IBM“绿色地平线”计划(Green Horizon)的合作伙伴之一。IBM与北京市相关单位合作并共同研发,利用IBM认知计算、大数据分析以及物联网技术的优势,分析空气监测站和气象卫星传送的实时数据流,凭借自学习能力和超级计算处理能力,提供未来72小时的高精度空气质量预报,实现对北京地区的污染物来源和分布状况的实时监测。

绿色地平线项目IBM实验室会跟环保局、监测站,收取很多的检验数据,通过软件做预计分析。比如原来可以预测3天,现在可能提前到10天。

据IBM大中华区硬件系统部PowerSystems产品总监李红介绍,IBM实验室有一套资产算法,去分析大气污染,提供算法服务和支撑。因为是计算密集型的,需要大量计算,所以用到了刚刚发布的S812LC平台。包括其他产品在内,构成了整个云平台环境,去完成对大数据的分析,对污染环境的预测等等。这个项目目前还在进行中,政府也希望这个项目未来可以推广扩展到其他的城市。

总的来看,IBM Power8依然是高性能、高可靠性的代表,它比较适合计算比较密集的场景,更适合于做数据仓库、做批处理、数据挖掘、模型建模等方面应用。因此,它与Hadoop也就有着不解之缘,未来的各种行业应用还在拓展之中,让我们拭目以待!


本文作者:云中子

来源:51CTO

相关文章
|
1月前
|
机器学习/深度学习 人工智能 Rust
Grok-1:史上最大开源LLM的技术解析
Grok-1:史上最大开源LLM的技术解析
1260 1
|
5月前
|
存储 分布式计算 Hadoop
【大数据】Hadoop技术解析:大数据处理的核心引擎
【大数据】Hadoop技术解析:大数据处理的核心引擎
169 0
|
6月前
|
分布式计算 Hadoop Linux
Hadoop开源已经实现
Hadoop开源已经实现
|
6月前
|
算法 Java 程序员
月薪3W+ 多亏发现GitHub开源的百万星Java神技-中高级核心知识解析
一提到高薪职业,大多数人最先想到的就是程序员。前几天,阿嘴正好刷到一条关于“程序员薪资”的帖子,一位网友问:想听个实话,程序员真的很容易月薪三四万吗? 这条帖子快速吸引了许多人的关注,短短几日内评论量上涨到300+,程序员的薪资待遇真的有那么好吗?大家是怎么回答的?和阿嘴一起来看看吧!
|
1天前
|
分布式计算 网络协议 Hadoop
|
14天前
|
分布式计算 资源调度 监控
Hadoop生态系统深度剖析:面试经验与必备知识点解析
本文深入探讨了Hadoop生态系统的面试重点,涵盖Hadoop架构、HDFS、YARN和MapReduce。了解Hadoop的主从架构、HDFS的读写流程及高级特性,YARN的资源管理与调度,以及MapReduce编程模型。通过代码示例,如HDFS文件操作和WordCount程序,帮助读者巩固理解。此外,文章强调在面试中应结合个人经验、行业动态和技术进展展示技术实力。
|
2月前
|
Java API Spring
开源!一款基于Spring Boot的二维码生成和解析工具
开源!一款基于Spring Boot的二维码生成和解析工具
39 1
|
3月前
|
JSON fastjson 数据库
字符编码导致Rapidjson(腾讯开源的json解析库)到Fastjson(阿里开发的Java json解析库)转换失败的原因分析
最近在客户端的开发的过程中,使用到了RapidJson,公司的开发是客户端和数据库端都由不同的人进行开发,我负责的客户端的逻辑开发(使用c++),开发工具同时使用了VS2017和QT的编译环境,使用QT主要是为了客户端界面开发方便,而使用了VS环境主要是维护公司开发的数据库接口库,这个库的唯一作用就是作为一个中间桥梁,使用Rapidjson将数据库接口的json数据格式解析为结构体数据,从而在客户端界面进行展示,或者接收客户端的数据,使用Rapidjson将其转换为json数据,发送给数据库接口以保存数据使用 。不太明白的可以参考我上一篇文章说明Rapidjson的使用过程-Parse解析数组
53 0
|
4月前
|
存储 分布式计算 Hadoop
Hadoop分块存储解析及还原分块存储的文件
Hadoop分块存储解析及还原分块存储的文件
24 0
|
4月前
|
缓存 应用服务中间件 网络安全
10个顶级Linux开源反向代理服务器 - 解析与导航
10个顶级Linux开源反向代理服务器 - 解析与导航
403 2

热门文章

最新文章

推荐镜像

更多