2023年及以后的七个大数据趋势预测

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 2023年及以后的七个大数据趋势预测

大数据初创厂商Dataddo公司首席执行官Petr Nemeth日前对全球2023年最重要的大数据发展趋势进行了预测。

与人们可能认为的相反,如今投资数字化转型的企业比例并不比新冠疫情发生之前高多少,处于数字化转型更高级阶段的企业所占的比例如今更高。

他们正在使用更多的数据生成工具,与更多的最终用户共享数据,并在管理数据方面做出更一致的努力。

这对有效的数据管理和商业智能的未来发展提出了许多问题。例如,是否需要更多的工具?如何确保他们生成的数据持续集成、共享和正确解释?将如何确保数据安全和干净?

以下是对2023年及以后的七个大数据趋势的预测,可以帮助商业领袖了解这些问题的答案。

对2023年大数据趋势的预测

(1)数据生成工具变得更加多样化,但每种工具的客户生命周期变得更短

毫无疑问,可用的SaaS工具的数量以及它们产生的数据量将会继续增长。预计2023年SaaS市场规模是2019年的两倍。企业每年都在采用越来越多的工具,而且没有看到结束的迹象。这样做的一个不太明显的副作用可能是缩短了这些工具的平均客户生命周期。

各种规模的企业每年在很少使用的工具方面浪费大量的费用。他们不断地尝试采用新的工具,但与此同时却忘记了其他工具。

此外,许多工具是在部门、团队和员工层面上采用的,导致大企业对其部署的SaaS工具的一半一无所知,小企业对大约三分之一的工具一无所知。

为了减少未使用工具的支出浪费,人们将看到IT部门加强整合和清理,这将缩短大多数SaaS工具的生命周期。

例外的是对企业基础设施至关重要的工具,例如CRM和数据集成工具 。

(2)数据集成变得与架构无关

如今,企业通常使用单独的平台进行ETL/ELT、反向ETL,有时还进行数据复制。

这是可以理解的,因为ETL/ELT和数据复制是数据集成世界中已经建立的流程,反向ETL是一个非常新的流程,只有少数的供应商提供。

反向ETL也是现代数据架构的最后一部分,因此对它感兴趣的企业通常已经与ETL/ELT和数据复制解决方案的供应商建立了关系。因此,为反向ETL寻找一个单独的平台似乎很自然。

但是,随着时间的推移,数据集成将成为业务的核心方面,企业将不再意识到集成过程之间的差异。用于集成的工具将变得更加用户友好,用户将不再需要考虑连接数据源和数据目的地的工程类型。

他们想要一个服务于所有集成类型的与架构无关的平台。

业务人员变得更有数据素养,从低代码到无代码的商业智能,数据集成工具成为标准。

认识到需要精通数据的非技术专业人士的比例很高(Qlik公司在2022年的一项调查显示为58%),期望他们精通数据的决策者的比例更高(Forrester公司在2022年进行的一项调查显示为82%)。如果这些专业人士想要在就业市场上保持竞争力,他们将不得不培养过去是工程师专属领域的能力。

对他们来说,幸运的是,运营数据工具(商业智能工具、数据集成工具,甚至一些数据存储)所需的技术知识越来越少。

根据调研机构Gartner公司的预测,到2025年,70%由企业开发的新应用程序将依赖于低代码和无代码技术。虽然“低代码”和“无代码”这两个术语经常用于描述开发平台,但人们将越来越多地看到它们用于描述商业智能和数据集成平台。

这一趋势再加上企业内部对数据素养的推动,将有效地减轻工程师的工作,并使非技术员工能够构建自己的数据解决方案。

(3)对公民数据科学家的需求仍在增加

公民数据科学家是业务部门的专业人士,他们对数据和分析有一定的了解,有时也会编码,但他们并不是数据科学家。在不久的将来,他们将在弥合业务团队和数据团队之间的差距方面发挥重要作用。他们的职责包括确定成功的度量,收集和解释数据,评估和部署数据模型。

根据美国劳工统计局的预测,到2029年,数据科学领域的增长将超过其他任何领域。因此,像英国石油公司和Epsilon这样的全球性公司已经从公民数据科学家那里获益也就不足为奇了。

这类新专业人员的崛起将对许多企业的数据治理策略产生去中心化的影响,这是由中心辐射型治理模型定义的。

由此产生的业务团队的授权将把数据团队的重点转移到安全和质量上。

(4)数据安全成为买家关注的主要问题

对于那些希望在运营层面拥有更大分析灵活性的企业来说,分散数据能力是必要的。但是,随着数据泄露和其他隐私问题越来越普遍,这也使他们面临更高程度的风险。

在欧洲,数据保护部门不断对违反GDPR法规的行为开出罚单,其中一些科技公司遭到高昂的罚款。到目前为止,2022年最高一笔罚款高达4.05亿欧元,这是Instagram所有者Meta Platforms公司在2022年9月遭到的罚款数额。

尽管美国联邦没有专门的数据隐私法,但企业仍要担心各州的相关法律,当然还要防范黑客的攻击。微软、Uber、红十字会和News Corporatio等企业和机构在2022年都遭到了黑客攻击。

SaaS买家正在注意到并很快会更加意识到他们向供应商提供了哪些数据。供应商将发现,如果没有类似SOC2这样的认证,就很难完成大宗交易。人们可以看到这一点。最终,数据安全将优先于用户友好性和价格等其他购买标准。

(5)数据质量仍然是一个挑战,人工智能在清理数据方面发挥着更大的作用

只要一直在收集数据,数据质量就一直是一个挑战。随着数据来自越来越多的不同来源,并由越来越多的业务线专业人员处理,将错误扩散到下游系统带来的损失变得越来越显著。

Gartner公司在2021年估计,不良数据每年给企业造成的平均损失为1290万美元。

尽管确保数据质量是一个难题,但在分析和数据集成工具中逐步实施基于人工智能的机制将极大地有助于保持高质量(例如Dataddo是一款集成工具,内置人工智能异常检测器) 。

这些技术将在标记异常值方面变得越来越好,并将丢失、不正确和损坏的数据排除在管道和仪表板之外。

同样重要的是要注意,由于基于人工智能的数据质量解决方案在长期分析大型数据集时总是最有效的,因此它们应该始终与以人为本的解决方案一起实施。

(6)商业智能工具成为被动使用的移动友好型工具

商业智能进入移动领域似乎很自然。数据的消费者(例如营销人员、销售人员和上层管理人员)经常需要访问数据,像仓库工作人员和卡车司机这样不会在电脑前花费大量时间的专业人士需要采用移动商业智能工具。

因此,移动商业智能的市场价值预计将从2021年的100亿美元增长到2030年的约555亿美元。然而,这只是全球商业智能市场价值的一小部分,预计商业智能市场的价值将从2020年的352亿美元增加到2028年的2242亿美元。

无论移动商业智能工具变得多么先进和精简,将主要用于提供见解。对于产生见解,采用台式机将永远是主流。

(7)保持领先

数字化转型的竞赛是一场极具活力的竞赛。保持行业领先的一种方法是密切关注数据管理和商业智能的新兴趋势。它们可以让人们预测即将发生的事情,并有助于了解如今实施的战略。

企业应该考虑:

  • 通过为最终用户提供更多支持,积极推动SaaS工具的采用。
  • 投资于面向未来的数据集成工具。
  • 培养非技术业务专业人员的数据素养。
  • 尽一切努力符合国际数据安全标准。
相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
人工智能 算法 开发工具
预测五大数据和人工智能趋势
预测五大数据和人工智能趋势
|
传感器 云安全 分布式计算
2014年大数据市场趋势十大预测
大数据是2013年热度最高的技术词汇,这一年大数据市场也实现了高速增长,越来越多的企业开始拥抱大数据解决方案,而随着生态系统的日益成熟,Hadoop也不再是天才技术人员的玩具,而是数据科学家和业务人员手中挖掘数据商业价值的强大“矿机”。
179 0
2014年大数据市场趋势十大预测
|
机器学习/深度学习 人工智能 架构师
|
人工智能 大数据 数据挖掘
|
分布式计算 大数据 Hadoop
|
安全 物联网 大数据
|
机器学习/深度学习 分布式计算 算法