带你读《2022年开源大数据热力报告》——热力“摩尔定律”和热力图谱

简介: 带你读《2022年开源大数据热力报告》——热力“摩尔定律”和热力图谱

开源大数据热力的“摩尔定律”


每隔40个月,热力值提升1倍

我们按照数据处理的生命周期,对开源大数据项目进行了技术分类,包括「数据集成」、 「数据存储」、「批处理」、「流处理」、 「数据查询与分析」、 「数据可视化」、 「数据调度与编排」、 「数据开发与管理」8个类别。2022年开源大数据总热力值,增长到2015年的4倍。每隔40个月,热力值提升1倍。


热力变迁反映技术趋势

开发者对「数据查询与分析」保持了长期的开发热情,连续8年位于热力值榜首。

2017年「流处理」热力值超过「批处理」,大数据处理进入实时阶段。

数据规模越来越大,数据结构更多样化,「数据集成」从2020年开始爆发式增长。

近2年来,活跃的新兴项目为「数据调度与编排」、 「数据开发与管理」注入新的活力。


2025年总热力值将突破3万

按照目前热力增长趋势预测,到2025年,总热力值将突破3万, 「数据集成」、 「数据调度与编排」、 「数据开发与管理」将成为强劲的热力增长点。


image.png

image.png


开源大数据热力图谱

image.png



相关文章
|
存储 SQL 分布式计算
开源大数据比对平台设计与实践—dataCompare
开源大数据比对平台设计与实践—dataCompare
593 0
|
SQL 大数据 关系型数据库
开源大数据比对平台(dataCompare)新版本发布
开源大数据比对平台(dataCompare)新版本发布
945 0
|
SQL 存储 分布式计算
从0到1介绍一下开源大数据比对平台dataCompare
从0到1介绍一下开源大数据比对平台dataCompare
1125 0
|
机器学习/深度学习 分布式计算 大数据
开源大数据平台的发展
开源大数据平台的发展
277 0
|
数据可视化 大数据 定位技术
GIS:开源webgl大数据地图类库整理
GIS:开源webgl大数据地图类库整理
673 0
|
人工智能 分布式计算 大数据
开源大数据平台 3.0 技术解读
阿里云研究员,阿里云计算平台事业部开源大数据平台负责人王峰围绕新一代的流式湖仓、全面 Serverless 化、更智能的开源大数据等多维度解读开源大数据平台 3.0~
1852 1
开源大数据平台 3.0 技术解读
|
分布式计算 大数据 Serverless
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
在2024云栖大会开源大数据专场上,阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash,该引擎100%兼容Apache Flink标准,性能提升5-10倍,助力企业降本增效。此外,EMR Serverless Spark产品启动商业化,提供全托管Serverless服务,性能提升300%,并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行,欢迎报名参加。
877 6
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
|
存储 机器学习/深度学习 大数据
参与开源大数据Workshop·杭州站,共探企业湖仓演进实践
Apache Flink 诚邀您参加 7 月 27 日在杭州举办的阿里云开源大数据 Workshop,了解流式湖仓、湖仓一体架构的最近演进方向,共探企业云上湖仓实践案例。
346 12
参与开源大数据Workshop·杭州站,共探企业湖仓演进实践
|
分布式计算 大数据 Hadoop
开源大数据方案有哪些
开源大数据方案有哪些
359 0
|
机器学习/深度学习 监控 大数据
Serverless 应用的监控与调试问题之Flink在整个开源大数据生态中应该如何定位,差异化该如何保持
Serverless 应用的监控与调试问题之Flink在整个开源大数据生态中应该如何定位,差异化该如何保持