在开源模式下云计算大数据的现状浅析

简介:

大数据

“开源”模式带来的好处很多,其中最吸引人的就是可以帮助企业降低成本。另外,开源模式消除了供应商的限制和壁垒,并且可让技术变得更加协作,合作者会不断更新开源软件,使技术得到持续的完善和发展。云计算和大数据目前都是热门话题,两者的发展与开源技术的结合,及如何在云上实现大数据项目,都是新的实践领域。

  开源云计算现状

云计算发展到今天,已经成为企业IT基础设施的主流选择;以Docker为代表的Container技术,也推动着云计算在PaaS层面的发展;而SaaS应用更是方兴未艾。云计算已经从概念走向实际应用,且将愈加促进信息化、工业化的整合进程。

敏捷、灵活、可定制,这是各大公司在解释他们为什么投资云计算时最爱提到的三个词。与此同时,当今领先的云供应商虽然心中想着最佳的技术利益,但从财务权益方面来考虑,却阻止他们提供开放的云环境。因此,在这个企业IT“云”化的过程中,开源技术正在成为未来的重要选择。

开源云计算带来的好处很多,其中最吸引人的就是可以帮助企业降低成本。另外,开源模式消除了供应商的限制和壁垒,并且可让技术变得更加协作,合作者会不断更新开源软件,使该技术得到持续的完善和发展。

有关开源云计算的系统、产品与服务正得到不断地创新推出。以目前拥有最多传统IT巨头支持的云架构开源项目OpenStack为例,在国内外都受到了普遍关注。2014年年OpenStack基金会发布的白皮书中显示,OpenStack在实际生产环境的部署已得到大幅提升,并且在传统行业的渗透已经呈现规模化趋势,在制造业、能源、零售、医疗、交通、保险、媒体等行业长势喜人。从全球用户活跃度来看,欧洲和亚洲力量凸显,中国用户在其贡献排行榜上位居第五。7月30 日开幕的可信云大上,OpenStack开源云项目联盟宣布成立。在政府层面上对这件事情的推动,使我们更加深刻地感受到OpenStack以及开源云这种模式在中国的影响力之大。

然而,任何事情都是一把双刃剑,目前的开源云也同样存在着明显的缺点。比供应商的独立缺乏支持、开源云工具的支持问题有待进一步解决。另外,像OpenStack、Docker等时下流行的开源云计算应用,都存在着技术成熟度欠缺、缺乏完整性等问题。

开源大数据现状

移动互联网、云计算等技术的快速水之土日,使全球数据量得到爆炸性增长,大数据时代已经全面到来。从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户“口味”的产品和服务,并结合用户需求有针对性地调整和优化自身,这就是大数据技术所带来的巨大价值。

而面对庞大的业务、海量的数据都在不断的增长,几乎没有任何一家传统的商业方案能够独立解决这些业务。企业内部的“合作”已经成为局限,要想应对这些,需要更多的力量,这无疑给开源模式带来了新的机遇和挑战。开源浪潮之所以风生水起,是因为成本低、灵活性强,又有受过培训的人员,帮助使业更好地挖掘隐藏在大数据当中的价值。

Hadoop无疑是目前大数据领域中最热的开源技术,它承诺能够降低成本同时获得企业级的IT自由度。 Hadoop、R和NoSQL现在是许多企业制定的大数据战略的三大支柱,无论这些战略是管理非结构化数据,还是对非结构化数据进行复杂的统计分析。这些开源技术平台与专有软件相比的一个优势就在于,于它们能够更快速地改进。而且它们也得到许多不同机构的不断开发和完善。Hadoop已经变得无处不在,EMC、戴尔、IBM、甚至微软都已经开始跻身Hadoop阵营。国内的盛大、百度、人人网等都已经开始应用Hadoop技术。

大数据领域的另一位生力军Spark现在也是名声大噪,作为通用的并行处理框架,Spark具有类似Hadoop的一些优点,而且Spak在迭代计算上具有比Hadoop更高的效率,还提供了更为广泛的数据集操作类型的开发等等。众多优越的性能和比Hadoop更广泛的适用面让Spark的进一步发展值得期待。

结语

综上所述,开源模式确实为企部和开发者署云环境创造了条件,推动了云技术的发展。但是,站在用户的角度看,特别是不具备软件开发、运维能力的传统企业,大规模采用开源云项目仍然存在一定的风险。另外,开源的开放所带来的一大弊端就是安全问题。也正是出于对这种风险的考虑,目前有很多大数据项目都没有放在云环境中运行。

但是,不管怎样,云计算与大数据在应用中产生的价值是有目共睹的,两者之间的结合,远比相互分离要好得多。而在选择云计算及大数据的平台时,企业一定要结合自己的实际情况和需求来选择适合自己的云计算平台,避免单纯为了开源、为了云而做出盲目的选择。当然从长远考虑,与开源想法搭起桥梁要比试图对开源想法视若无明智得多。


本文作者:佚名

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
11月前
|
存储 人工智能 物联网
云计算助力医疗信息化,推动智慧医疗新模式。
云计算正深刻改变医疗行业,通过高效数据存储、管理与共享,优化医疗资源分配,推动远程医疗发展。它解决了“数据孤岛”问题,强化了数据安全与隐私保护,同时助力智慧医疗建设,降低信息化成本并提升服务效率。未来,云计算将与5G、AI等技术融合,进一步促进医疗服务智能化与规范化,为医疗行业带来全新可能。
569 7
|
7月前
|
存储 Java 大数据
Java 大视界 -- Java 大数据在智能家居能源消耗模式分析与节能策略制定中的应用(198)
简介:本文探讨Java大数据技术在智能家居能源消耗分析与节能策略中的应用。通过数据采集、存储与智能分析,构建能耗模型,挖掘用电模式,制定设备调度策略,实现节能目标。结合实际案例,展示Java大数据在智能家居节能中的关键作用。
|
11月前
|
存储 弹性计算 分布式计算
云端智链:挖掘云计算中的大数据潜能
云端智链:挖掘云计算中的大数据潜能
268 21
|
11月前
|
安全 大数据 虚拟化
随着云计算和大数据技术的发展,Hyper-V在虚拟化领域的地位日益凸显
随着云计算和大数据技术的发展,Hyper-V在虚拟化领域的地位日益凸显。作为Windows Server的核心组件,Hyper-V具备卓越的技术性能,支持高可用性、动态迁移等功能,确保虚拟机稳定高效运行。它与Windows深度集成,管理便捷,支持远程管理和自动化部署,降低管理成本。内置防火墙、RBAC等安全功能,提供全方位安全保障。作为内置组件,Hyper-V无需额外购买软件,降低成本。其广泛的生态系统支持和持续增长的市场需求,使其成为企业虚拟化解决方案的首选。
|
12月前
|
人工智能 大数据
阿里云云计算ACA、大数据ACA、人工智能ACA三门认证升级调整公告
阿里云云计算ACA、大数据ACA、人工智能ACA三门认证升级调整公告
|
存储 分布式计算 大数据
大数据与云计算:无缝结合,开启数据新纪元
大数据与云计算:无缝结合,开启数据新纪元
789 11
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
5月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
418 14
|
7月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
269 4
|
6月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
442 0