大数据真的在云计算上的快车上吗?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

软件初创厂商AtScale公司去年年底发布了其年度大数据成熟度调查报告(以前称为“Hadoop成熟度调查”),显示商业智能大数据是首要任务,并正处于云计算的快速发展阶段,数据治理越来越受到关注。

该报告及其结果在最近ODPi用户顾问委员会(UAB)的会议上成为了一个主要的讨论话题,ODPi用户顾问委员会(UAB)是由来自汽车,技术和娱乐行业等使用Apache Hadoop和其他大数据技术的大型企业的代表组成。ODPi UAB十分认同报告中所提出的日益增长的数据治理问题。自助服务访问大数据和这种自助服务的治理确实触动了人们的心弦。行业专家讨论了让人们帮助推动自助服务访问政策的概念,这反映出越来越多的数据科学家是业务部门的一部分,而不是IT部门。该小组一致认为,仅持有治理和安全控制的IT目前的状态是不具成本效益的,而自治可能是一种帮助规模使用的策略。

关于云计算中大数据的主题,ODPi UAB在混合云模型中看到了他们的未来。虽然他们认为人们将在未来三年内看到云计算更多的应用,但他们将会在现有投资的基础上开展,而不是完全取代现有的投资。此外,ODPi UAB认为现有的中央处理与本地处理节点相辅相成,以帮助扩大需求,更好地遵守法规。目前,UAB成员看到全面扩展到云计算成本过高,但随着物联网数据本身运行的用例开始增长,云计算将变得更加有趣。

大数据真的在云计算上的快车上吗?

在ODPiUAB阐述之后,然后回到企业自己的使用模式。在本文中将介绍这些使用模式,ODPiUAB提供的见解以及云计算在Hadoop和大数据中的作用的体验。预生产和生产Hadoop之间有明显的区别。

表1概述了随着企业使用情况的变化,运营Hadoop的核心差异。

大数据真的在云计算上的快车上吗?

AtScale公司的报告指出,73%的受访者在使用生产,与2015年同期相比增长了8%。调研机构Gartner公司的业务调查报告为15%以上。由于在数量上有如此大的差异,很明显在行业中部署阶段的基线定义并不明确。UAB和ODPi成员在这里已经提出了这个详细的部署,认为它们与市场准确匹配。

大数据真的在云计算上的快车上吗?
企业Hadoop部署连续性

绘制出适合于连续性的位置,可以更客观地看待生产使用情况。

分析大数据的云计算

虽然72%的受访者表示计划在云端实施大数据,但更深入的分析可能会显示出一些重要的细微差别。UAB成员希捷技术公司企业分析总监Nicholas Berg表示:“要进行深入研究,人们还会问:企业的应用程序和IT在本地部署数据中心和云计算中的比例是多少?企业的大数据在本地部署数据中心和云计算中的比例是多少?最后,企业在云中的实际生产有多少?我敢打赌这个百分比要小得多。”

另一个ODPiUAB成员评论说:“我认为很多公司只是在云中进行概念验证(POC)测试,但仍然在内部数据中心进行生产部署。”UAB认为,这里的主要驱动力是人们认识到IT需要最大限度地降低风险和成本。

这引出了云计算中最大的没有解决的问题:成本。多年来,云计算供应商一直在推动“降低成本和复杂性-走向云”的叙述,“避免服务器采购的资本支出-只是利用云”等等。然而,ODPiUAB明确的一个因素是,当企业扩大规模时,云计算将变得更昂贵。

ODPi UAB一位成员谈到自己的经验,并表示,“最近,我们已经对数字不起作用做了一些成本分析,而不是当人们谈论入口或出口数据量时重新考虑。这就是云供应商的成本真正开始飞涨的地方,因此,当企业完全转向云端时数字不起作用。所以我们仍然在考虑实验的目的,但是没有看到人们如何完全移动到云端,甚至考虑把大量的系统移到那里。我发现云端工作适用于小规模的子集,如果企业愿意,这可能是一种聚合,但是一旦试图进行长期的存储,它将使成本增加的非常快速。”

这是否意味着ODPi UAB成员感觉到Hadoop和云中的大数据是注定失败的,除非成本下降?当然不是。对他们来说,问题在于云计算的叙述,而在场景上,不断被认为是““非此即彼”的讨论,而不是“两者兼用”的讨论。

云计算:物联网数据的用例

ODPi UAB的一位成员分享了一个物联网数据的使用情况,“当企业正在考虑解决某些问题时,将不同区域的数据转移到云计算中处理,云计算开始变得更有意义。当人们开始谈论物联网时尤其如此,企业难道真的想在自己的数据中心运行所有的物联网数据吗?人们查看一下描述的用例,就会发现所有的数据在自己的数据中心将面临一些问题,无论是在数量上还是在法律上。例如德国等一些国家,除非要在这些国家建立数据中心。”而其他专家也赞同这种看法。他说:”我们认为云平台的存在也是一个挑战,特别是作为一家在全球各地设有办事处的全球性公司,如果不想在每个国家和地我建立数据中心,那么采用云计算是一个很好的选择。”

从上述所有ODPi UAB反馈意见来看,很明显,云计算将继续成为Hadoop和大数据的一个组成部分,但与组织的成本和效率需求保持一致。换句话说,就像其他技术转向云端一样,最现实的答案往往在某种形式的混合中。Nicholas Berg说,“我想随着时间的推移,Hadoop将在云中的应用更加广泛,希望其成本结构变得更加合理,事情就会开始转变。我认为这是会发生的,只是时间问题。我们可能总是有某种混合部署,随着经济和用例更好地随着时间的推移,云计算的使用率可能会更高。”

下一件大事

人们生活在行业中,坦率地说是一个世界中-而寻求下一件大事情,将会激发行业人士成长和发展的愿望。行业先锋经常拒绝接受现状,认识到完美从未实现,并总是不断追求。正如Vince Lombardi曾经说过,“完美是无法实现的,但如果我们追求完美,那么我们可以实现卓越。”

话虽如此,有一件很少有成果的事情就是强化创新。顺应技术潮流,应对现代生活的挑战和机遇,如果你听过专业运动员的采访,他们总是会说下一步要达到什么目标,技术也是如此,但规模更大,人们对此并不总是很清楚。 


原文发布时间为:2017-10-26

本文作者:佚名

本文来自云栖社区合作伙伴“51CTO”,了解相关信息可以关注。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
存储 SQL 关系型数据库
你对MySQL的int(11)真的了解吗?
首先,需要明确的是,int(3)和int(11)都是表示整数类型,而不是定义整数的存储长度。在MySQL中,INT类型占据4个字节(32位),可以存储范围是-2^31到2^31-1(约-2.1亿到2.1亿),这个范围是固定的,不受括号中数字的影响。
516 3
你对MySQL的int(11)真的了解吗?
|
安全 Windows
搜狗输入法双击输入框崩溃问题
【8月更文挑战第27天】搜狗输入法双击输入框崩溃可能由多种因素造成,包括软件冲突、输入法版本问题、系统故障、设置错误及硬件问题。建议检查并解决潜在冲突软件,更新输入法版本,修复系统文件,调整输入法设置,以及确保硬件正常工作。通过逐步排查,通常可定位并解决问题。
529 0
|
算法 安全 Linux
Ansible自动化工具copy复制用法
Ansible 中的 copy 模块用于将文件或目录从本地计算机或远程主机复制到远程主机上的特定位置。它是一个功能强大的模块,可用于各种文件传输任务. ### 作用 将配置文件复制到远程服务器 将应用程序部署到远程服务器 将日志文件从远程服务器复制到本地计算机 备份和恢复文件和目录
385 2
Ansible自动化工具copy复制用法
|
Ubuntu 安全 Linux
Linux必备|如何重置忘记的 Root 密码
Linux必备|如何重置忘记的 Root 密码
2006 7
|
监控 Oracle 网络协议
ASM 管理的 Oracle 19C 数据库ADG的搭建及主备切换
-- 主备库Grid及Oracle Home 目录 /u01/app/grid/product/19.0.0/gihome_1 /u01/app/oraInventory /u01/app/oracle/product/19.
2047 0
|
JavaScript Java 测试技术
基于Java的程序设计实践项目管理系统的设计与实现(源码+lw+部署文档+讲解等)
基于Java的程序设计实践项目管理系统的设计与实现(源码+lw+部署文档+讲解等)
94 0
|
分布式计算 资源调度 Hadoop
在文件存储HDFS版上使用 Apache Spark
本文档主要介绍如何在挂载文件存储HDFS版的 Hadoop 集群上安装及使用 Spark。
493 0
|
机器学习/深度学习 算法 搜索推荐
|
3天前
|
弹性计算 关系型数据库 微服务
基于 Docker 与 Kubernetes(K3s)的微服务:阿里云生产环境扩容实践
在微服务架构中,如何实现“稳定扩容”与“成本可控”是企业面临的核心挑战。本文结合 Python FastAPI 微服务实战,详解如何基于阿里云基础设施,利用 Docker 封装服务、K3s 实现容器编排,构建生产级微服务架构。内容涵盖容器构建、集群部署、自动扩缩容、可观测性等关键环节,适配阿里云资源特性与服务生态,助力企业打造低成本、高可靠、易扩展的微服务解决方案。
1101 0
|
2天前
|
机器学习/深度学习 人工智能 前端开发
通义DeepResearch全面开源!同步分享可落地的高阶Agent构建方法论
通义研究团队开源发布通义 DeepResearch —— 首个在性能上可与 OpenAI DeepResearch 相媲美、并在多项权威基准测试中取得领先表现的全开源 Web Agent。
461 9