Apache Flink Agents 0.2.0 发布公告

简介: Apache Flink Agents 0.2.0发布!该预览版统一流处理与AI智能体,支持Java/Python双API、Exactly-Once一致性、多级记忆(感官/短期/长期)、持久化执行及跨语言资源调用,兼容Flink 1.20–2.2,助力构建高可靠、低延迟的事件驱动AI应用。

Apache Flink 社区很高兴地宣布 Apache Flink Agents 0.2.0 版本正式发布,您可以通过以下方式获取 Flink Agents 0.2.0:

请注意,Agents 0.2.0 是一个预览版本(Preview Version),这意味着:

  • 部分功能可能存在已知或未知的缺陷。您可以通过 Github Issues 查看已知问题列表及其解决状态。

  • 当前的 API 和配置选项处于实验阶段,在未来版本中可能会发生不向后兼容的变更。

  • 我们非常感谢您的任何反馈,无论是分享您的使用案例、建议新功能、帮助定位和修复漏洞,还是其他任何想法。您的见解对我们至关重要。

您可以通过以下方式联系我们:


什么是 Apache Flink Agents?

Apache Flink Agents 是 Apache Flink 的一个新子项目,直接在Apache Flink 的流式运行时(streaming runtime)上构建事件驱动的 AI 智能体(Event-driven AI Agents)。它将流处理与自主智能体统一在同一个框架中,将Apache Flink 经受过实战检验的优势——大规模扩展性、低延迟、容错性和状态管理,与智能体的核心能力——大语言模型(LLMs)、工具、记忆和动态编排有机结合。

为什么 Apache Flink Agents 至关重要?

虽然 AI 智能体在chatbots和copilots等交互式应用中取得了飞速进展,但这些系统通常以同步、一次性交互的方式运行。然而,许多业务场景不能等待用户输入指令后才采取行动。在电子商务、金融、物联网和物流等场景中,必须在感知到实时事件(如支付失败、传感器异常或用户点击)时立即做出关键决策。

要在生产环境中取得成功,企业级Agents必须具备以下能力:

  1. 处理实时、高吞吐的事件流,如交易流、传感器异常或用户行为轨迹。

  2. 持续且自主地运行,而不仅仅是在收到提示词(prompt)时才运行。

  3. 保证安全性、可审计性,并在发生故障时能够恢复。

这些工作不仅需要智能,更需要大规模扩展能力、毫秒级延迟、容错性以及有状态的协调能力。而这些正是 Apache Flink 的核心强项。

此前,尚未有一个统一的框架能将Agentic AI 模式引入 Flink 成熟的流处理生态系统中。Apache Flink Agents 填补了这一空白,将Agents视为始终在线、可靠且可扩展的事件驱动微服务。

核心特性

Apache Flink是流计算领域的事实标准,Apache Flink Agents 继承了分布式、大规模、高可用的结构化数据处理和成熟的状态管理能力,并为Agentic AI 的构建和功能增加了自由的抽象,包括:大语言模型(LLMs)、提示词(prompts)、工具(tools)、记忆(memory)、动态编排、可观测性等。

Apache Flink Agents 的关键特性包括:

  • 大规模扩展与毫秒级延迟:利用 Flink 的分布式处理引擎,实时处理大规模事件流。

  • 无缝的数据与 AI 集成:Agents直接与 Flink 的 DataStream 和 Table API 交互进行输入和输出,实现结构化数据处理与语义 AI 能力在 Flink 内部的平滑集成。

  • Exactly-Once 一致性:通过外置的 Action State Store 扩展 Flink 原本的 Checkpoint 机制,从而确保 Agent 中 Action 执行、模型推理、工具调用及其影响的精确一直一致性

  • 成熟的Agent抽象:利用广为人知的 AI Agent概念,使具有Agent系统开发经验的开发者能够快速上手并构建应用,无需陡峭的学习曲线。

  • 多语言支持:提供 Python 和 Java 的原生 API,能够无缝集成到不同的开发环境中,允许团队使用其偏好的编程语言。

  • 丰富的生态系统:原生支持对主流模型服务与向量存储的集成,,以及托管在 MCP 服务器上的工具或提示词,同时支持自定义扩展。

  • 可观测性:采用以事件为中心的编排方法,所有智能体行为都由事件连接和控制,从而能够通过事件日志观察和理解智能体的行为。


0.2 版本有哪些新变化?

Java API 功能对齐

在 Flink Agents 0.1 中,部分功能仅在 Python API 中可用。0.2 版本通过在 Java 中增加以下能力的完整支持,弥补了这一差距:

  • 嵌入模型(Embedding Models)

  • 向量存储(Vector Stores)

  • MCP 服务器(MCP Server)

  • 异步执行(Asynchronous Execution)

至此,Java API 在功能上已与 Python API 完全对齐。

扩展的生态集成

Flink Agents 0.2 引入了对更广泛的模型服务和向量数据库的原生支持:

  • 对话模型(Chat Models):

    • Python API 现支持 Azure OpenAI。

    • Java API 增加了对 Azure AI、Anthropic 和 OpenAI 的支持。

  • 嵌入模型(Embedding Models):

    • Java API 现支持 Ollama。
  • 向量数据库(Vector Stores):

    • Java API 现支持 Elasticsearch。

此外,0.2 版本现支持跨语言资源访问。用户可以在一种语言编写的智能体中,调用另一种语言提供的集成支持。例如:在 Python 智能体中调用 Java 支持的 Azure AI 对话模型。
(注:跨语言资源访问目前不支持在异步执行代码块中使用。使用跨语言集成时,框架内置动作将回退到同步执行。)

记忆系统重构

Flink Agents 0.2 对其记忆管理系统进行了全面升级。相比之前仅支持短期记忆,新版本引入了三种不同的记忆类型:

  1. 感官记忆(Sensory Memory): 在单次智能体运行中维护状态并传递上下文。

  2. 短期记忆(Short-Term Memory): 在多次智能体运行之间保留精确的上下文信息。

  3. 长期记忆(Long-Term Memory): 实现大规模上下文信息的近似语义检索,并提供初步的信息摘要和压缩支持。

持久化执行(Durable Execution)

Flink Agents 0.1 提供了Action级的精确一次执行。在 0.2 版本中,这一能力被精细化到了更小的颗粒度。你现在可以在一个Action内指定特定的代码块进行持久化执行。在故障恢复时,即使整个Action尚未完成,任何已成功执行的持久化代码块都不会重新运行。
这有助于避免:

  • 冗余的模型调用(节省时间、Token 并减少不可预测性)。

  • 重复工具调用产生的副作用(例如:重复付款或重复发送电子邮件通知)。

多版本 Flink 兼容性

Flink Agents 0.1 仅兼容 Apache Flink 1.20.3。
Flink Agents 0.2 现支持更广泛的 Flink 版本:1.20, 2.0, 2.1 和 2.2。
(注:建议始终使用所选 Flink 小版本(x.y)的最新补丁版本(x.y.z),以获得更多已知问题的修复。)


破坏性变更(Breaking Changes)

Python API

  • 创建 ResourceDescriptor 的 API 已更改。在之前版本中,用户通过 clazz=Type[Resource] 指定资源提供者;在 0.2 版本中,应通过 clazz=ResourceName 指定,我们为内置集成提供了常量字符串。

  • RunnerContext.execute_async 方法已更名为 durable_execute_async

  • MCPToolMCPPromptMCPServer 不再被视为 API,已从 api 模块中移出。

配置

  • ERROR_HANDLING_STRATEGY 现在不仅影响 ReAct Agent,而是影响所有智能体。它已从 ReActAgentConfigOptions 移至 AgentExecutionOptions

Java Ollama 对话模型

  • 对话模型设置中的 extract_reasoning 参数类型从 string 更改为 boolean,默认值从 false 更改为 true

  • 引入了新参数 think 用于控制是否启用思考模式。extract_reasoning 不再影响此行为。


贡献者名单

Apache Flink 社区感谢以下每一位为本次发布努力的贡献者:

Alan Z., Eugene, Ioannis Stavrakantonakis, Liu Jiangang, Marcelo Colomer, Shekharrajak, Weiqing Yang, Wenjin Xie, Xiang Li, Xintong Song, Xuannan, Yash Anand, chouc, dependabot[bot], tsaiggo, twosom


阿里云的 Flink Agents 团队正在北京、上海招聘!如果你对实时计算、AI 数据基础设施充满热情,欢迎加入我们,点击链接或直接邮箱投递!

了解详情:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=100000943005&trace=qrcode_share

邮箱:xintong.sxt@alibaba-inc.com

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
5天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
414 125
|
8天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
702 5
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
5天前
|
缓存 人工智能 运维
阿里云618百炼大模型Qwen3.7-Max功能、免费试用、订阅计费、配置接入详解
Qwen3.7-MAX是阿里云百炼平台推出的通义千问3.7系列旗舰大语言模型,专为智能体时代复杂任务打造,依托阿里云全域算力与自研技术,在逻辑推理、长文本处理、代码工程、长周期自主执行等领域达到行业顶尖水平。2026年618期间,该模型推出多重免费试用权益、按量计费5折、订阅套餐优惠等专属福利,覆盖个人开发者、团队与企业全场景需求,以下从核心功能、免费试用、订阅计费、配置接入四方面展开详细解析。
409 123
|
3天前
|
人工智能 自然语言处理 API
阿里云Token Plan团队版解析:功能、三档套餐与省钱订阅指南
阿里云百炼平台推出的Token Plan团队版,是面向企业与团队的AI大模型订阅服务,以Credits为统一计量单位,整合文本与图像生成模型,提供团队管理、数据安全、多工具兼容等核心能力,解决团队零散订阅AI服务的管理混乱、成本失控、数据安全等痛点。本文将从核心定位、套餐详情、计费规则、团队管理、工具兼容、便宜订阅技巧等方面,全面解析Token Plan团队版,帮助企业与团队高效、低成本地使用AI服务。
304 108
|
4天前
|
存储 人工智能 数据可视化
别再手动复制 Skill 了:多 Agent 时代的 Skill 管理方案
多 Agent 场景下 Skill 的统一管理与同步。
250 125
|
18天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
12天前
|
缓存 人工智能 运维
GLM 5.2自托管全流程实战:硬件选型、vLLM/SGLang部署与成本盈亏测算
2026年智谱发布GLM 5.2超大混合专家模型,区别于以往仅开放API的闭源大模型,该模型权重以MIT开源协议对外发布,企业与开发者可完整下载、本地审计、私有化部署,实现数据不出环境、自定义微调、自主调度推理资源。GLM 5.2拥有753B总参数,原生支持百万级上下文窗口,在代码生成、长文档推理、数学逻辑等多项基准测试中对标国际顶尖商用模型,是首款可完整自托管的前沿代码向大模型。
915 0
|
13天前
|
Linux 程序员 数据格式
【2026最新】Notepad++下载、安装和使用一篇搞定(附中文版安装包)
Notepad++ 是一款免费开源、轻量高效的 Windows 文本编辑器,支持 C/Python/HTML 等 80+ 语言语法高亮、代码折叠、正则替换、编码转换及插件扩展,专为程序员与文本处理用户打造,完美替代系统记事本。(239字)