从 Gemini 看 AI 系统设计的新趋势:上下文正在成为基础设施

简介: 本文探讨AI应用演进的关键转折:上下文正从临时输入升维为系统级资产。随着AI从“调用模型”转向“运行系统”,上下文的持久化、迁移性、版本化与解耦能力,已成为决定长期可用性的核心基础设施,远超模型参数本身。

过去两年,AI 应用的讨论重点几乎都围绕在模型能力本身:

参数规模、推理能力、多模态效果、基准测试成绩。

但在越来越多真实项目中,一个逐渐清晰的共识正在形成:

限制 AI 系统长期可用性的,往往不是模型能力,而是上下文的承载方式。

近期,Gemini 在产品层面测试的一些新能力,再次将这个问题推到了台前——

AI 正在从“调用模型”,转向“运行系统”。


一、当 AI 不再是一次性调用

在早期阶段,AI 系统的使用方式相对简单:

  • 输入 Prompt
  • 调用模型
  • 获取结果

上下文更多只是一次请求内的附属参数,生命周期极短。

但当 AI 被用于真实业务场景后,问题开始显现:

  • 项目具有长期连续性
  • 用户行为存在历史依赖
  • 决策过程需要被反复追溯

这时,“上下文”不再只是 Prompt 的一部分,而变成了一种系统状态

如果上下文无法被稳定保存、复用、迁移,那么 AI 系统就很难支撑复杂业务。


二、从工程视角理解“上下文迁移”

从表面看,聊天记录迁移只是一个产品功能;

但从工程角度看,它本质上对应的是一个更底层的问题:

AI 系统的上下文,是否具备跨周期、跨系统的可迁移性?

在企业级 AI 架构中,这个问题往往体现在几个具体层面:

  • 长期上下文如何持久化
  • 多模型之间是否共享同一状态
  • 用户偏好、决策路径是否被系统理解
  • 历史推理结果是否可以复用

如果这些能力缺失,AI 系统就会始终停留在“工具调用层”,而无法演进为稳定的业务组件。


三、上下文,正在从“输入”变成“资产”

一个明显的趋势是:

上下文正在被重新定义为系统资产,而不是临时输入。

这意味着架构设计需要发生相应变化:

  • 上下文需要有明确的生命周期管理
  • 状态需要被版本化、结构化
  • 系统需要为未来迁移预留空间

从这个角度看,AI 系统越来越接近传统分布式系统中的状态服务,而不是简单的无状态接口。

这也是为什么,越来越多团队在实践中发现:

模型可以随时替换,但一旦上下文设计失误,系统调整成本极高。


四、对企业级 AI 架构的几点启示

如果把视角从具体产品抽离,可以得到几条相对通用的工程启示:

第一,上下文应被视为一等公民

它不应只存在于 Prompt 中,而应有独立的数据结构与存储策略。

第二,AI 系统需要为演进而设计

模型会变化,但上下文体系应保持相对稳定。

第三,多模型时代要求状态解耦

上下文不应与某个具体模型强绑定,否则会限制系统扩展性。

第四,系统复杂度正在上移

AI 的复杂度,正在从模型侧转移到系统侧。


结语

从更宏观的角度看,AI 应用正在经历一次角色转变:

从“调用模型的工具”,

走向“承载智能的系统”。

在这个过程中,上下文不再是被忽略的细节,而正在成为新的基础设施层。

对开发者和企业而言,真正需要提前思考的,也许不是“该选哪个模型”,

而是:系统是否已经为长期上下文与持续演进做好准备。

相关实践学习
流水线运行出错排查难?AI帮您智能排查
本实验将带您体验云效流水线Flow的智能排查能力,只需短短1-2分钟,即可体验AI智能排查建议。
ALPD云架构师系列 - 云原生DevOps36计
如何把握和运用云原生技术,撬动新技术红利,实现持续、安全、高效和高质量的应用交付,并提升业务的连续性和稳定性,这是云原生时代持续交付共同面对的机会和挑战。本课程由阿里云开发者学堂和阿里云云效共同出品,是ALPD方法学云架构师系列的核心课程之一,适合架构师、企业工程效能负责人、对DevOps感兴趣的研发、测试、运维。 课程目标 前沿技术:了解云原生下DevOps的正确姿势,享受云原生带来的技术红利 系统知识:全局视角看软件研发生命周期,系统学习DevOps实践技能 课程大纲: 云原生开发和交付:云研发时代软件交付的挑战与云原生工程实践 云原生开发、运行基础设施:无差别的开发、运行环境 自动部署:构建可靠高效的应用发布体系 持续交付:建立团队协同交付的流程和流水线 质量守护:构建和维护测试和质量守护体系 安全保障:打造可信交付的安全保障体系 建立持续反馈和持续改进闭环
相关文章
|
2月前
|
人工智能 自然语言处理 数据可视化
Google Code Wiki:GitHub代码库秒变可交互文档
Google Code Wiki 利用 AI 为代码库构建动态知识层,通过 Tree-sitter 解析结构、生成知识图谱,并结合混合检索策略实现精准问答。支持自动文档生成、可视化图表与自然语言交互,让代码可读、可问、可演进,大幅提升理解效率。
338 6
Google Code Wiki:GitHub代码库秒变可交互文档
|
1月前
|
人工智能 安全 前端开发
D2大会 界面即推理:解读 Google A2UI 如何探索 Agent 交互新标准
Google A2UI开源项目,以声明式JSON协议让AI按需生成安全、跨平台的动态界面,破解Agent交互“最后一公里”难题。D2大会将揭秘其设计哲学、多智能体UI协作及开源路线图。
|
3月前
|
人工智能 监控 Java
请求限流
本文介绍如何使用Sentinel实现接口限流与降级,通过配置QPS阈值保护商品查询接口,并结合JMeter进行压测验证。同时讲解了线程隔离机制,包括信号量隔离的应用,确保系统在高并发下的稳定性。
请求限流
|
1月前
|
人工智能 监控 安全
阿里云轻量服务器部署 OpenClaw(原Clawdbot)指南:功能解析与实操步骤
OpenClaw(曾用名Clawdbot、Moltbot)是一款开源的本地优先AI代理与自动化平台,核心定位并非传统对话机器人,而是通过整合多渠道通信能力与大语言模型,构建具备持久记忆、主动执行能力的定制化AI助理。其核心优势在于“实际完成任务”——例如用户指令整理邮件时,它会直接完成分类、提取要点并生成提醒,而非仅罗列操作步骤。本文结合官方部署文档与技术解析,详细介绍OpenClaw的核心功能、阿里云轻量服务器部署流程及常见问题处理,全程无营销词汇,确保信息准确且贴合实操需求。
786 1
|
1月前
|
人工智能 弹性计算 自然语言处理
2026年阿里云 OpenClaw(Clawdbot)一键部署教程(图文版)
2026年AI Agent爆发在即,OpenClaw(原Clawdbot/Moltbot)作为开源、本地优先的AI智能代理平台,支持7×24小时私人助理部署。它不止聊天,更能执行文件处理、日程管理、跨平台自动化等真实任务,兼容Qwen/GPT/Claude等多模型,是您的全能“数字员工”。
468 17
|
1月前
|
人工智能 自然语言处理 供应链
AI Agent 职业路线全解析:从入门到精通的体系化进阶指南
随着“人工智能+”深入推进,AI智能体正从辅助工具升级为协作伙伴。2027年应用率将超70%,催生生成式AI测试员、智能体设计师等新岗。我国AI人才缺口超500万,人社部、教育部已将其纳入国家职业与教育体系。本文梳理四阶进阶路径(零代码构建→流程集成→全栈开发→行业落地),助力开发者构建“人机协同”核心竞争力。(239字)
208 1
|
5月前
|
Linux 虚拟化 iOS开发
VMware Workstation Pro 25H2 Unlocker & OEM BIOS 2.7 - 在 Windows 和 Linux 上运行 macOS Tahoe
VMware Workstation Pro 25H2 Unlocker & OEM BIOS 2.7 - 在 Windows 和 Linux 上运行 macOS Tahoe
1323 3
VMware Workstation Pro 25H2 Unlocker & OEM BIOS 2.7 - 在 Windows 和 Linux 上运行 macOS Tahoe
|
3月前
|
数据处理
Dataphin功能Tips系列(82)「Dataphin标签管理」:让数据资产分类与检索更高效、更智能
Dataphin通过标签化管理优化数据资产组织,支持按业务、地域、时间等多维度灵活打标,提升“门店销售表”等数据的检索效率与使用便捷性,实现精准高效的资产管理。
133 0