开源大数据热力的“摩尔定律”
每隔40个月,热力值提升1倍
我们按照数据处理的生命周期,对开源大数据项目进行了技术分类,包括「数据集成」、 「数据存储」、「批处理」、「流处理」、 「数据查询与分析」、 「数据可视化」、 「数据调度与编排」、 「数据开发与管理」8个类别。2022年开源大数据总热力值,增长到2015年的4倍。每隔40个月,热力值提升1倍。
热力变迁反映技术趋势
• 开发者对「数据查询与分析」保持了长期的开发热情,连续8年位于热力值榜首。
• 2017年「流处理」热力值超过「批处理」,大数据处理进入实时阶段。
• 数据规模越来越大,数据结构更多样化,「数据集成」从2020年开始爆发式增长。
• 近2年来,活跃的新兴项目为「数据调度与编排」、 「数据开发与管理」注入新的活力。
2025年总热力值将突破3万
按照目前热力增长趋势预测,到2025年,总热力值将突破3万, 「数据集成」、 「数据调度与编排」、 「数据开发与管理」将成为强劲的热力增长点。
开源大数据热力图谱