未来 云计算将在大数据领域扮演怎样的角色?

简介:

企业存储环境主要是围绕记录系统构建起来的,侧重于这些问题:为数据记录长度固定的文件购买哪些类型的存储介质和管理系统,所存储数据的性质是实时数据、准实时数据,还是只是偶尔需要访问或完全可以用数据归档保存起来的批量填充的数据等。

自从大数据进入企业数据中心和业务部门,一切改变了――单个的大数据文件可以用数TB、甚至数PB来衡量。Hadoop等分析平台上的大数据并行处理与事务数据的按顺序处理有着明显区别。不出所料,存储方面要考虑的因素随之变化。

这种变化在数据分析和高性能计算领域体现得最为明显。这个领域以Hadoop应用程序为主,它们借助算法分析方法并行处理数PB级数据,用于数据科学及其他复杂查询。就高性能应用程序而言,很难考虑像虚拟化存储或基于云的存储这些概念,因为你只有通过数据中心的物理处理器和存储平台,才能直接处理并存储数据和查询结果。

因此,这种工作具有的计算密集性和存储密集性使数据中心管理人员(包括存储专业人员)不再像过去十年那样,迫切寻求的虚拟化或云计算。作为大数据对象存储特点的单一数据集的庞大性也是如此,它们使用元数据标签来描述非传统数据图像,比如照片、视频、音频记录和文档图像等。

鉴于这些发展动向,云计算在大数据领域可以扮演什么角色呢?

答案是冷存储(cold storage),这个领域仍没有得到企业界的充分利用。冷存储是极其便宜、速度很慢、驻留在磁盘的数据,存储起来放到归档上,妥善保存起来。在日常的IT中,这些数据很少有机会需要用到,所以如果你把它转移到异地数据存储库很方便,不必让它在你的数据中心或运营系统中占用空间。如果该数据存储库在云端,你就能够从数据中心远程访问它,没必要大老远跑到异地拿起磁盘或磁带。

云计算和虚拟存储在数据集市也存在发展前景。现在许多公司使用数据集市为不同的部门运行批量查询。数据集市中所用的数据大多是批量创建,基本是过去用来查询的传统数据。不同之处在于,用户现在拥有比过去更多的分析报告创建工具和选项用于查询,而且数据管理员更能够生成从不同来源聚合的数据。在这种批量环境下,磁盘存储解决方案用起来就跟过去一样有效。

存储管理员需要应对大数据带来的变化,尤其是如何应对众多极其庞大的大数据文件。这就需要专门的磁盘和处理,在大多数情况下,还需要与云计算和虚拟化项目背道而驰的本地存储。在另一方面,商用冷存储解决方案可能会最终消除这个困境:很少使用的数据驻留在机房的过时磁盘和磁带驱动器上,无人照管。

====================================分割线================================

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
存储 大数据 数据挖掘
云计算与大数据:从基础设施到实际应用
云计算与大数据:从基础设施到实际应用
110 0
|
1月前
|
存储 大数据 数据挖掘
python数据分析——大数据和云计算
大数据和云计算作为当代信息技术的两大核心驱动力,正在以前所未有的速度改变着我们的生活、工作和思维方式。它们不仅为各行各业的创新提供了强大的技术支持,更是推动了整个社会的数字化转型。 从大数据的角度来看,它的核心价值在于通过对海量数据的收集、存储、分析和挖掘,发现其中的关联性和趋势,从而为决策提供更为科学、精准的依据。无论是商业领域的市场预测、消费者行为分析,还是公共服务领域的城市规划、交通管理,大数据都发挥着不可或缺的作用。同时,随着物联网、传感器等技术的普及,大数据的来源和种类也在不断扩展,这使得我们能够更全面地认识世界,把握规律。
47 0
|
2月前
|
SQL 分布式计算 数据挖掘
认识SQL在云计算中的新角色
SQL在云计算中的新角色正在重新定义数据分析的边界和可能性。通过云计算平台的支持和与其他数据分析工具的集成,SQL在数据处理、查询和分析方面展现出了强大的能力。未来,随着技术的不断进步和创新,我们有理由相信SQL将在数据分析领域发挥更加重要的作用,为企业和组织创造更大的价值。
17 1
|
2月前
|
监控 物联网 大数据
智慧工地管理平台系统源码基于物联网、云计算、大数据等技术
智慧工地平台APP通过对施工过程人机料法环的全面感知、互联互通、智能协同,提高施工现场的生产效率、管理水平和决策能力,实现施工管理的数字化、智能化、精益化。
53 0
|
4月前
|
资源调度 分布式计算 大数据
【云计算与大数据技术】资源管理、调度模型策略的讲解
【云计算与大数据技术】资源管理、调度模型策略的讲解
103 0
|
4月前
|
资源调度 大数据 调度
【云计算与大数据技术】集群资源统一管理系统YARN、Mesos、Omega讲解(图文解释 超详细)
【云计算与大数据技术】集群资源统一管理系统YARN、Mesos、Omega讲解(图文解释 超详细)
66 2
|
4月前
|
消息中间件 大数据 Apache
【云计算与大数据技术】流计算讲解及集群日志文件实时分析实战(附源码)
【云计算与大数据技术】流计算讲解及集群日志文件实时分析实战(附源码)
47 1
|
4月前
|
云计算
电子好书发您分享《阿里云认证的解析与实战-云计算ACP认证》
电子好书发您分享《阿里云认证的解析与实战-云计算ACP认证》
61 1
|
1月前
|
弹性计算 NoSQL 数据库
电车卷?云计算更卷,阿里云领头降价,2024阿里云服务器又降价了!
电车卷?云计算更卷,阿里云领头降价,2024阿里云服务器又降价了!