连续三年蝉联第一,Flink 荣膺全球最活跃的 Apache 开源项目

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: Apache 软件基金会 2020 年度总结发布,Flink 多项排名领先!

2020年,一个注定会被历史铭记的一年。在全球化合作受到挑战的大环境下,作为全球最大的开源软件基金会,Apache 软件基金所引领的开源社区,依然汇聚了全球的顶尖开发人员,交出了一份鼓舞人心的成绩单。2021年1月1日,Apache 基金会在其官方博客上发表了文章《Apache in 2020 - By The Digits》[1],用数字回顾了2020 一整年的社区发展:

Apache 软件基金会在过去的一年中,来自各个领域共计 238 个项目共迭代了接近 3500 个发布版本。
Apache 软件基金会的所有开源软件在如今贡献着超过 220 亿美元的价值。
Apache 的线上会议吸引了超过 150 个国家接近 5750 名参与者,为期两天的Apache Con 更是吸引了超过 150 万的浏览。

而 Apache Flink 作为 Apache 软件基金会 199 个顶级项目中的一员,在这份报告中,无论从社区用户活跃度、开发者活跃度,还是曝光度等多个维度上,都取得了卓然的成绩。

社区邮件列表活跃度:TOP 1

邮件列表(mailing list)是 Apache 软件基金会各个项目常用的,用于开发者和使用者之间进行沟通的渠道,一般分为开发者交流 (dev@ mailing list)和用户交流(user@ mailing list)两个频道,我们往往会用邮件列表的活跃度来反映社区的交流沟通活跃度。2020年,Flink 取得了用户交流邮件频道第一名和开发者交流频道第二名的好成绩:

image.png

特别值得一提的是,在前20名邮件列表中,Flink 社区是唯一提供中文用户交流频道的(user-zh@flink.apache.org),而且其活跃度在2020年中仅次于 Flink 的英文用户邮件列表。自2018年开始,Flink 在邮件列表的活跃度已连续三年蝉联第一,我们很欣喜地看到越来越多的中文母语使用者在开源社区中发声,为全球开源软件社区带来不可忽视的影响力。

Commits 提交:TOP 2

开源项目在过去一年的新增提交(commit)数,是一种常用的衡量开源项目开发活跃度的指标。Apache 软件基金会每年都会公布去年的最多提交数的前五名,而 Flink 在2020年度新增 commit 数目中排名第二,仅次于路由引擎构建构建软件Apache Camel。如果把范围限制在大数据计算/存储领域,Apache Flink 则是当仁不让的开发者最活跃的项目。如果放眼到过去的 2019 [2]、2018年 [3] 年度报告,每年的最活跃的5个开源软件中,都能看到大数据领域的身影,其中 Flink、Hadoop、HBase、Beam、Airflow、Spark 均有过上榜,我们绘制了如下的表格来描述这一趋势(由于只公布了 TOP5,所以有些项目会在某些年份落榜):

image.png

Apache Flink 是唯一近三年都连续出现在 TOP5 中,并且排名不断上升的大数据相关开源项目。

由于每年的 TOP5 名单都会发生变化,我们又对近三年上过榜的项目统计了 commits 数目[4],并绘制了如下的统计图表,可以看出 Flink 的 commit 数目逐年增长,并且在2020年表现十分亮眼,进一步扩大了其在大数据项目中的优势。

image.png

GitHub 访问量:TOP 2

Apache Flink 社区除了在开发和用户交流方面有着极高的活跃度,其在互联网世界中还有着极高的曝光量和浏览度。Apache 软件基金会统计了2020年度访问 Flink 的 Github 页面的流量,在所有项目中位居第二。

由于2018、2019年的 Apache 软件基金会的自然年年度总结报告中并没有展示这一指标,我们在2019财年(2018.5.1 - 2019.4.30)年报[5] 和2020财年(2019.5.1 - 2020.4.30)年报[6]中找到了 Github 访问流量的指标:

image.png

可以看出,从2018年年中开始,Flink 的曝光浏览度从总第三名上升到2020年的第二名。

总结

通过 Apache 软件基金会2020年的总结,并结合 2018、2019 年的总结、财年年报,我们可以看到 Flink 已经毋庸置疑地茁壮成长为 Apache 头部项目之一。无论是用户交流活跃度、开发活跃度、还是影响力等多方面都已经稳居在 Apache 所有开源软件项目 TOP 位置。

同时,刚刚落幕的 Flink 社区年度盛会 Flink Forward Asia 2020,我们也见证了 Flink 社区的高速发展与技术创新、流批一体在生产环境的落地,越来越多的企业如字节跳动、小米、网易、知乎等都在探索使用 Flink 做流批一体统一架构的方案。

这其中,来自中国的大量开发者和用户无疑是其能取得相关成绩的最重要的原因之一,正在阅读本文的您,想必也正在为 Apache 的最顶尖项目之一贡献着一份力量。如今,2021年已然到来,相信在新的一年中,Apache Flink 会继续朝着流批一体化、离线实时一体化、大数据与 AI 一体化演进,取得更大的成绩!

实时即未来,Flink 社区期待您的参与!

参考文献

[1] Apache in 2020 - By The Digits
https://blogs.apache.org/foundation/entry/apache-in-2020-by-the
[2] Apache in 2019 - By The Digits
https://blogs.apache.org/foundation/entry/apache-in-2019-by-the
[3] Apache in 2018 - By The Digits
https://blogs.apache.org/foundation/entry/apache-in-2018-by-the
[4] commits数统计参考命令 git rev-list --after="Jan 1 2020" --before="Jan 1 2021" --all --no-merges --count
[5] Apache FY2019 annual report
https://files-dist.s3.amazonaws.com/AnnualReports/FY2019+Annual+Report.pdf
[6] Apache FY2020 annual report
https://www.apache.org/foundation/docs/FY2020AnnualReport.pdf

社区二维码.png

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
25天前
|
存储 人工智能 大数据
The Past, Present and Future of Apache Flink
本文整理自阿里云开源大数据负责人王峰(莫问)在 Flink Forward Asia 2024 上海站主论坛开场的分享,今年正值 Flink 开源项目诞生的第 10 周年,借此时机,王峰回顾了 Flink 在过去 10 年的发展历程以及 Flink社区当前最新的技术成果,最后展望下一个十年 Flink 路向何方。
313 33
The Past, Present and Future of Apache Flink
|
3月前
|
SQL Java API
Apache Flink 2.0-preview released
Apache Flink 社区正积极筹备 Flink 2.0 的发布,这是自 Flink 1.0 发布以来的首个重大更新。Flink 2.0 将引入多项激动人心的功能和改进,包括存算分离状态管理、物化表、批作业自适应执行等,同时也包含了一些不兼容的变更。目前提供的预览版旨在让用户提前尝试新功能并收集反馈,但不建议在生产环境中使用。
896 13
Apache Flink 2.0-preview released
|
3月前
|
存储 缓存 算法
分布式锁服务深度解析:以Apache Flink的Checkpointing机制为例
【10月更文挑战第7天】在分布式系统中,多个进程或节点可能需要同时访问和操作共享资源。为了确保数据的一致性和系统的稳定性,我们需要一种机制来协调这些进程或节点的访问,避免并发冲突和竞态条件。分布式锁服务正是为此而生的一种解决方案。它通过在网络环境中实现锁机制,确保同一时间只有一个进程或节点能够访问和操作共享资源。
114 3
|
1天前
|
消息中间件 存储 Apache
恭喜 Apache RocketMQ、Apache Seata 荣获 2024 开源创新榜单“年度开源项目”
近日,以“新纪天工、开物焕彩——致敬开源的力量”为活动主题的“重大科技成就发布会(首场)”在国家科技传播中心成功举办,并隆重揭晓了 2024 开源创新榜单,旨在致敬中国开源力量,传播推广开源科技成就,营造中国开源创新生态。2024 年开源创新榜单由中国科协科学技术传播中心、中国计算机学会、中国通信学会、中国科学院软件研究所共同主办,中国开发者社区承办,以王怀民院士为首组建评审委员会,进行研讨评审,面向中国开源行业领域,遴选具有创新性、贡献度和影响力的开源项目、社区、应用场景与开源事件。在评审出的 10 个年度开源项目中,Apache RocketMQ、Apache Seata 成功入选。
|
3月前
|
分布式计算 监控 大数据
大数据-148 Apache Kudu 从 Flink 下沉数据到 Kudu
大数据-148 Apache Kudu 从 Flink 下沉数据到 Kudu
91 1
|
3月前
|
数据挖掘 物联网 数据处理
深入探讨Apache Flink:实时数据流处理的强大框架
在数据驱动时代,企业需高效处理实时数据流。Apache Flink作为开源流处理框架,以其高性能和灵活性成为首选平台。本文详细介绍Flink的核心特性和应用场景,包括实时流处理、强大的状态管理、灵活的窗口机制及批处理兼容性。无论在实时数据分析、金融服务、物联网还是广告技术领域,Flink均展现出巨大潜力,是企业实时数据处理的理想选择。随着大数据需求增长,Flink将继续在数据处理领域发挥重要作用。
230 0
|
4月前
|
运维 数据处理 数据安全/隐私保护
阿里云实时计算Flink版测评报告
该测评报告详细介绍了阿里云实时计算Flink版在用户行为分析与标签画像中的应用实践,展示了其毫秒级的数据处理能力和高效的开发流程。报告还全面评测了该服务在稳定性、性能、开发运维及安全性方面的卓越表现,并对比自建Flink集群的优势。最后,报告评估了其成本效益,强调了其灵活扩展性和高投资回报率,适合各类实时数据处理需求。
|
2月前
|
存储 分布式计算 流计算
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
本文介绍了阿里云开源大数据团队在实时计算领域的最新成果——向量化流计算引擎Flash。文章主要内容包括:Apache Flink 成为业界流计算标准、Flash 核心技术解读、性能测试数据以及在阿里巴巴集团的落地效果。Flash 是一款完全兼容 Apache Flink 的新一代流计算引擎,通过向量化技术和 C++ 实现,大幅提升了性能和成本效益。
1412 73
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
zdl
|
2月前
|
消息中间件 运维 大数据
大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群
本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。
zdl
173 56
|
7天前
|
存储 关系型数据库 BI
实时计算UniFlow:Flink+Paimon构建流批一体实时湖仓
实时计算架构中,传统湖仓架构在数据流量管控和应用场景支持上表现良好,但在实际运营中常忽略细节,导致新问题。为解决这些问题,提出了流批一体的实时计算湖仓架构——UniFlow。该架构通过统一的流批计算引擎、存储格式(如Paimon)和Flink CDC工具,简化开发流程,降低成本,并确保数据一致性和实时性。UniFlow还引入了Flink Materialized Table,实现了声明式ETL,优化了调度和执行模式,使用户能灵活调整新鲜度与成本。最终,UniFlow不仅提高了开发和运维效率,还提供了更实时的数据支持,满足业务决策需求。

相关产品

  • 实时计算 Flink版
  • 推荐镜像

    更多