Fluss:重新定义实时数据分析与 AI 时代的流式存储
Apache Fluss 是一个专为实时分析与 AI 场景打造的流式存储系统,旨在解决传统架构中数据重复复制、成本高昂、延迟高等问题。它基于 Apache Arrow 构建,支持列式存储、KV 查询、湖仓集成与流批统一读取,显著提升机器学习与多模态数据处理效率。Fluss 已在阿里巴巴大规模落地,具备高性能、低成本、易扩展等优势,未来将深度集成多模态 AI 与开放数据生态,助力构建统一的实时数据底座。
Flink Forward Asia 2025 -上海站
8月16日 ,Apache Flink 社区年度技术盛宴 —— Flink Forward Asia 2025 城市巡回首战将在上海正式开启!本次巡回以“The Future of AI is Real-Time”为主题,汇聚实时计算领域的顶尖专家与行业先锋。
[VLDB 2025]面向Flink集群巡检的交叉对比学习异常检测
阿里云与华东师范大学合作论文《Noise Matters: Cross Contrastive Learning for Flink Anomaly Detection》被VLDB 2025接收。该研究聚焦Flink集群热点机器异常检测,提出跨对比学习方法,结合先验知识优化模型训练,有效应对噪声数据干扰,提升检测准确率。该技术已应用于Flink集群智能巡检系统,助力运维风险预警。
MSE ZooKeeper:Flink 高可用架构的企业级选择
本文深入解析了 Apache Flink 架构中 ZooKeeper 的核心作用,包括 Leader 选举、Checkpoint 管理、作业协调及配置管理等关键功能,并结合金融风控与电商推荐等典型场景,分析了 ZooKeeper 在实际应用中的技术实现。
Apache Flink 2.1.0: 面向实时 Data + AI 全面升级,开启智能流处理新纪元
Apache Flink 2.1.0 正式发布,标志着实时数据处理引擎向统一 Data + AI 平台迈进。新版本强化了实时 AI 能力,支持通过 Flink SQL 和 Table API 创建及调用 AI 模型,新增 Model DDL、ML_PREDICT 表值函数等功能,实现端到端的实时 AI 工作流。同时增强了 Flink SQL 的流处理能力,引入 Process Table Functions(PTFs)、Variant 数据类型,优化流式 Join 及状态管理,显著提升作业稳定性与资源利用率。