拥抱开源!解析IBM Power8与Hadoop的不解之缘

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云解析 DNS,旗舰版 1个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

大数据分析不仅改变了企业开展业务的地点和方式,而且还在改变业务决策流程的速度与范围。企业希望通过投资大数据分析技术来增强客户体验、提高客户忠诚度、开创全新的创收机会。他们需要部署经济高效的、高性能的、可靠敏捷的IT基础架构,以便利用特殊的数据资产来产生最佳业务成效。

与x86架构相比,客户能够通过数量更少但却更加可靠的Power8服务器来降低总体拥有成本(TCO)。更重要的是,这些客户还将能够受益于不断发展壮大的IBM合作伙伴开源生态圈(OpenPOWER基金会)及一致性附加处理器接口(CAPI)等颠覆性创新技术所交付的卓越价值。

IBM以开放的态度拥抱开源

IBM一直将开源合作视为创新驱动力,倡导、参与和支持Linux和开源软件,并将开源技术融入满足企业客户需求的各种方案中。IBM是大数据市场中规模最大的供应商。近10年来,他们投资超过150亿美元来开发全套的大数据解决方案。Power对开源的支持,也使今天的开发者更容易利用开源技术开发大数据分析应用。

IBM还在Power Systems服务器上提供最新版本的Ubuntu服务器、Ubuntu OpenStack和Canonical公司的JujuCloud Orchestration工具。基于Power 的Ubuntu为现有的Linux应用向Power移植提供简便的通道,用以轻松实现云部署,建成新的大数据和移动软件应用,并帮助提升现有云端应用的性能。基于Power 的Ubuntu对已经全线支持红帽和SUSE Linux操作系统的Power Systems产品线提供了良好的补充。

此外,IBM通过OpenPOWER基金会使POWER8用于开放式的开发。OpenPOWER基金会是一个多家业内公司围绕着POWER8平台成立的联合组织,致力于加快数据中心的创新及基于POWER8架构的系统设计变革。OpenPOWER基金会中不仅包括家喻户晓的科技巨头(如Google、Samsung、NVIDIA、Micron及Mellanox),还包括浪潮、中兴等国内企业。OpenPOWER基金会提供Power软硬件用于开放型开发,以及Power知识产权许可。Power8的开放将为大数据分析、移动、社交催生更好的基础架构平台。

Power8让Hadoop应用性能提升3.65倍

Hadoop是一个能够对大数据进行分布式存储和处理的软件框架,它具有高可靠性、高扩展、容错、高效、低成本的特点,一度广受互联网公司青睐,企业级用户也越来越多的接受Hadoop。但凡事都有两面性,佘晖表示,星环科技在做Hadoop应用和技术的时候,发现Hadoop是非常耗费计算资源的,用户希望获得更优秀的性能。

通过测试发现,IBM Power8产品非常适合Hadoop应用。据星环科技提供资料显示,在与IBM合作针对Hadoop的性能优化和调优后,IBM做了很多改进,与x86处理器相比,POWER8实现了3.65倍的运行速度提升。除了性能外,POWER在中国很多的行业、在企业级市场有着深厚的积淀和客户群,产品也非常适合这些客户,这也是星环科技选择POWER的原因。

大数据助力空气质量预测

拥有强大集群能力的POWER服务器在应用方面有何过人之处呢?帮助北京预测空气质量就是其中之一。IBM在去年就与北京市政府签署协议,利用先进的天气预报和云计算技术,协助中国防治大气污染。

据了解,北京市政府是IBM“绿色地平线”计划(Green Horizon)的合作伙伴之一。IBM与北京市相关单位合作并共同研发,利用IBM认知计算、大数据分析以及物联网技术的优势,分析空气监测站和气象卫星传送的实时数据流,凭借自学习能力和超级计算处理能力,提供未来72小时的高精度空气质量预报,实现对北京地区的污染物来源和分布状况的实时监测。

绿色地平线项目IBM实验室会跟环保局、监测站,收取很多的检验数据,通过软件做预计分析。比如原来可以预测3天,现在可能提前到10天。

据IBM大中华区硬件系统部PowerSystems产品总监李红介绍,IBM实验室有一套资产算法,去分析大气污染,提供算法服务和支撑。因为是计算密集型的,需要大量计算,所以用到了刚刚发布的S812LC平台。包括其他产品在内,构成了整个云平台环境,去完成对大数据的分析,对污染环境的预测等等。这个项目目前还在进行中,政府也希望这个项目未来可以推广扩展到其他的城市。

总的来看,IBM Power8依然是高性能、高可靠性的代表,它比较适合计算比较密集的场景,更适合于做数据仓库、做批处理、数据挖掘、模型建模等方面应用。因此,它与Hadoop也就有着不解之缘,未来的各种行业应用还在拓展之中,让我们拭目以待!
本文转自d1net(转载)

相关文章
|
7月前
|
存储 分布式计算 Hadoop
【专栏】Hadoop,开源大数据处理框架:驭服数据洪流的利器
【4月更文挑战第28天】Hadoop,开源大数据处理框架,由Hadoop Common、HDFS、YARN和MapReduce组成,提供大规模数据存储和并行处理。其优势在于可扩展性、容错性、高性能、灵活性及社区支持。然而,数据安全、处理速度、系统复杂性和技能短缺是挑战。通过加强安全措施、结合Spark、自动化工具和培训,Hadoop在应对大数据问题中保持关键地位。
205 1
|
存储 弹性计算 分布式计算
【ECS生长万物之开源】基于ECS实例搭建Hadoop环境
Hadoop是一款由Apache基金会用Java语言开发的分布式开源软件框架,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的能力进行高速运算和存储。本教程介绍如何在Linux操作系统的ECS实例上快速搭建Hadoop伪分布式环境。
|
存储 分布式计算 资源调度
平台服务 开源 Hadoop|学习笔记
快速学习平台服务 开源 Hadoop
平台服务 开源 Hadoop|学习笔记
|
缓存 运维 分布式计算
GitHub开源比Hadoop快至少10倍的物联网大数据平台
GitHub开源比Hadoop快至少10倍的物联网大数据平台
GitHub开源比Hadoop快至少10倍的物联网大数据平台
下一篇
DataWorks