从 Gemini 看 AI 系统设计的新趋势:上下文正在成为基础设施

本文涉及的产品
全域智能运维平台 STAROps 免费试用,10000 积分
简介: 本文探讨AI应用演进的关键转折:上下文正从临时输入升维为系统级资产。随着AI从“调用模型”转向“运行系统”,上下文的持久化、迁移性、版本化与解耦能力,已成为决定长期可用性的核心基础设施,远超模型参数本身。

过去两年,AI 应用的讨论重点几乎都围绕在模型能力本身:

参数规模、推理能力、多模态效果、基准测试成绩。

但在越来越多真实项目中,一个逐渐清晰的共识正在形成:

限制 AI 系统长期可用性的,往往不是模型能力,而是上下文的承载方式。

近期,Gemini 在产品层面测试的一些新能力,再次将这个问题推到了台前——

AI 正在从“调用模型”,转向“运行系统”。


一、当 AI 不再是一次性调用

在早期阶段,AI 系统的使用方式相对简单:

  • 输入 Prompt
  • 调用模型
  • 获取结果

上下文更多只是一次请求内的附属参数,生命周期极短。

但当 AI 被用于真实业务场景后,问题开始显现:

  • 项目具有长期连续性
  • 用户行为存在历史依赖
  • 决策过程需要被反复追溯

这时,“上下文”不再只是 Prompt 的一部分,而变成了一种系统状态

如果上下文无法被稳定保存、复用、迁移,那么 AI 系统就很难支撑复杂业务。


二、从工程视角理解“上下文迁移”

从表面看,聊天记录迁移只是一个产品功能;

但从工程角度看,它本质上对应的是一个更底层的问题:

AI 系统的上下文,是否具备跨周期、跨系统的可迁移性?

在企业级 AI 架构中,这个问题往往体现在几个具体层面:

  • 长期上下文如何持久化
  • 多模型之间是否共享同一状态
  • 用户偏好、决策路径是否被系统理解
  • 历史推理结果是否可以复用

如果这些能力缺失,AI 系统就会始终停留在“工具调用层”,而无法演进为稳定的业务组件。


三、上下文,正在从“输入”变成“资产”

一个明显的趋势是:

上下文正在被重新定义为系统资产,而不是临时输入。

这意味着架构设计需要发生相应变化:

  • 上下文需要有明确的生命周期管理
  • 状态需要被版本化、结构化
  • 系统需要为未来迁移预留空间

从这个角度看,AI 系统越来越接近传统分布式系统中的状态服务,而不是简单的无状态接口。

这也是为什么,越来越多团队在实践中发现:

模型可以随时替换,但一旦上下文设计失误,系统调整成本极高。


四、对企业级 AI 架构的几点启示

如果把视角从具体产品抽离,可以得到几条相对通用的工程启示:

第一,上下文应被视为一等公民

它不应只存在于 Prompt 中,而应有独立的数据结构与存储策略。

第二,AI 系统需要为演进而设计

模型会变化,但上下文体系应保持相对稳定。

第三,多模型时代要求状态解耦

上下文不应与某个具体模型强绑定,否则会限制系统扩展性。

第四,系统复杂度正在上移

AI 的复杂度,正在从模型侧转移到系统侧。


结语

从更宏观的角度看,AI 应用正在经历一次角色转变:

从“调用模型的工具”,

走向“承载智能的系统”。

在这个过程中,上下文不再是被忽略的细节,而正在成为新的基础设施层。

对开发者和企业而言,真正需要提前思考的,也许不是“该选哪个模型”,

而是:系统是否已经为长期上下文与持续演进做好准备。

相关实践学习
流水线运行出错排查难?AI帮您智能排查
本实验将带您体验云效流水线Flow的智能排查能力,只需短短1-2分钟,即可体验AI智能排查建议。
ALPD云架构师系列 - 云原生DevOps36计
如何把握和运用云原生技术,撬动新技术红利,实现持续、安全、高效和高质量的应用交付,并提升业务的连续性和稳定性,这是云原生时代持续交付共同面对的机会和挑战。本课程由阿里云开发者学堂和阿里云云效共同出品,是ALPD方法学云架构师系列的核心课程之一,适合架构师、企业工程效能负责人、对DevOps感兴趣的研发、测试、运维。 课程目标 前沿技术:了解云原生下DevOps的正确姿势,享受云原生带来的技术红利 系统知识:全局视角看软件研发生命周期,系统学习DevOps实践技能 课程大纲: 云原生开发和交付:云研发时代软件交付的挑战与云原生工程实践 云原生开发、运行基础设施:无差别的开发、运行环境 自动部署:构建可靠高效的应用发布体系 持续交付:建立团队协同交付的流程和流水线 质量守护:构建和维护测试和质量守护体系 安全保障:打造可信交付的安全保障体系 建立持续反馈和持续改进闭环
相关文章
|
5月前
|
人工智能 自然语言处理 数据可视化
Google Code Wiki:GitHub代码库秒变可交互文档
Google Code Wiki 利用 AI 为代码库构建动态知识层,通过 Tree-sitter 解析结构、生成知识图谱,并结合混合检索策略实现精准问答。支持自动文档生成、可视化图表与自然语言交互,让代码可读、可问、可演进,大幅提升理解效率。
716 6
Google Code Wiki:GitHub代码库秒变可交互文档
|
4月前
|
数据采集 人工智能 运维
企业建设数据治理系统费用(2026年最新版):聚焦瓴羊 Dataphin
2026年,瓴羊Dataphin作为阿里云核心数据治理平台,依托OneData方法论与AI增强能力,提供SaaS/私有化双模部署及模块化订阅计费(3万–300万元/年),覆盖中小至集团级企业。其智能建模、血缘分析、自然语言建模等能力显著降低隐性成本,助力企业高效构建可信数据底座。(239字)
|
4月前
|
人工智能 安全 前端开发
D2大会 界面即推理:解读 Google A2UI 如何探索 Agent 交互新标准
Google A2UI开源项目,以声明式JSON协议让AI按需生成安全、跨平台的动态界面,破解Agent交互“最后一公里”难题。D2大会将揭秘其设计哲学、多智能体UI协作及开源路线图。
|
6月前
|
人工智能 监控 Java
请求限流
本文介绍如何使用Sentinel实现接口限流与降级,通过配置QPS阈值保护商品查询接口,并结合JMeter进行压测验证。同时讲解了线程隔离机制,包括信号量隔离的应用,确保系统在高并发下的稳定性。
请求限流
|
4月前
|
人工智能 监控 安全
阿里云轻量服务器部署 OpenClaw(原Clawdbot)指南:功能解析与实操步骤
OpenClaw(曾用名Clawdbot、Moltbot)是一款开源的本地优先AI代理与自动化平台,核心定位并非传统对话机器人,而是通过整合多渠道通信能力与大语言模型,构建具备持久记忆、主动执行能力的定制化AI助理。其核心优势在于“实际完成任务”——例如用户指令整理邮件时,它会直接完成分类、提取要点并生成提醒,而非仅罗列操作步骤。本文结合官方部署文档与技术解析,详细介绍OpenClaw的核心功能、阿里云轻量服务器部署流程及常见问题处理,全程无营销词汇,确保信息准确且贴合实操需求。
1122 2
|
8月前
|
Linux 虚拟化 iOS开发
VMware Workstation Pro 25H2 Unlocker & OEM BIOS 2.7 - 在 Windows 和 Linux 上运行 macOS Tahoe
VMware Workstation Pro 25H2 Unlocker & OEM BIOS 2.7 - 在 Windows 和 Linux 上运行 macOS Tahoe
1821 3
VMware Workstation Pro 25H2 Unlocker & OEM BIOS 2.7 - 在 Windows 和 Linux 上运行 macOS Tahoe
|
Oracle 关系型数据库 Java
实时计算 Flink版操作报错之报错:Caused by: oracle.jdbc.OracleDatabaseException: ORA-01291如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
运维 分布式计算 监控
Dataphin深度评测:企业级数据中台的智能实践利器
Dataphin是一款以全链路治理、智能提效和高兼容性为核心的企业级数据中台工具,特别适用于中大型企业的复杂数据场景。其流批一体能力、资源监控工具及行业化模板库可显著提升数据治理水平并降低运维成本。通过周期补数据功能,历史数据修复效率提升约60%;智能建模功能使建模时间缩短50%。尽管在数据源支持(如SAP HANA、DB2)和用户体验上仍有改进空间,但其强大的功能使其成为构建企业级数据中台的优选工具,尤其适合零售、金融等行业需要高效数据治理与实时分析的企业。