编程简单了,部署依旧很难|Karpathy 演讲的 5 点解读

本文涉及的产品
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
任务调度 XXL-JOB 版免费试用,400 元额度,开发版规格
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 本文总结了 Andrej Karpathy 在 YC AI Startup School 的分享核心观点,涵盖软件发展的三个阶段、LLM 的定位与挑战、Agent 的产品工程思路以及编程与部署的未来趋势。内容适合 AI 领域从业者参考,强调通过提升工程能力实现 AI 应用的稳定性与可控性。完整视频链接附于文末,便于深入学习。

1.gif


看完了 Andrej Karpathy 在 YC AI Startup School 近 40 分钟的分享,有点意犹未尽。推荐观看完整视频(链接贴在文末阅读原文),没有任何模型架构,也没有任何算法细节,适合 AI 领域的所有从业者,包括 Agent Builder 和 Agent User。我们将一些核心观点进行了延展,并尝试用更易于理解的方式进行表达。


Software



软件 1.0 是“人写代码,机器照做”。我们用 if/else 来定义代码逻辑,告诉计算机每一步怎么干,就像在教一个听话但不会思考的助理。


软件 2.0 是“人给样本,机器自己学”。我们喂数据训练模型,让它自己学怎么做,再对输出进行调试,虽然过程有点黑箱,但效果不错,就像一个模仿能力很强的学徒。


软件 3.0 是“人说目标,机器理解并执行”。我们用自然语言告诉 AI 要做什么,它自己决定怎么做,就像在指挥一个聪明但偶尔出错的助手,我们不用再写具体的代码,而是在“发指令”。


LLM


认同 LLM 是一种新的电力,有基础公共设施的属性。


LLM 不只是建造一个发电厂,像投资晶圆场那样,还需要投入大规模的资金和高精尖人力。


更恰当的比喻是 LLM 是操作系统,并且是一个越来越复杂的软件生态系统,这不仅是大模型自身的多样性所决定的,也受到上下游的开发和部署工具的影响。


Agent



“滑动自治 Autonomy Slider”是获得 Agent 最大输出效果的必备产品工程,通过多轮的提示词和验证等机制,将 LLM 的自治能力纳入可控轨道,而不是让 Agent 完全自主。就像自动驾驶的分级(L1~L5),Agent 允许人在关键时刻“接管方向盘”。


把 Agent 拴在链子上,不要给 Agent 发大而泛的提示词,应是小而具体,输出要有验收逻辑。这不是在弱化 AI,而是在提升其产品稳定性,把 Agent 的行为纳入产品级约束框架中。例如,你提问“教我物理”,这会让 Agent 在森林里迷路,你也无法得到你想要的答案。


不要再尝试回答什么时候实现 AGI,而是提升产品工程和技术工程的质量(关于工程质量,推荐阅读这篇),让用户更易于去使用滑动自治。


Programming



编程越来越简单,但是部署依旧很难,例如要考虑身份安全、访问认证、支付验证等可用性问题,规模级的应用还要准备好可观测等稳定性相关的措施,这些不只是通过代码就能解决的,还依赖上下游的基础设施以及架构设计能力。


传统的基础设施是为人类设计的应用服务的,AI Infra 则应该是为 AI 设计的应用服务。Programning 是用户命令 LLM 做什么,但当前,Engineering 是各个 Vendor 的文档命令用户做什么,这是很大的区别。(🤔:这也许是 AI Infra Builder 们的机会?


阅读原文:https://www.bilibili.com/video/BV1SHKczUEzi/

相关文章
|
28天前
|
人工智能 安全 Java
AI Agent 的工程化被低估了
本文探讨了AI应用工程化的关键作用与实现路径,将其分为产品工程和技术工程两大部分。产品工程关注用户体验与交互设计,包括需求建模、UI/UX设计、系统提示词优化及反馈闭环构建,确保AI“能用、好用”。技术工程则聚焦系统稳定性与扩展性,涵盖架构模块化、工具调用机制、流量控制、数据管理及可观测性建设,保障AI应用“快、稳、强”。两者协同决定了AI Agent的实用性与规模化潜力,为行业提供了落地参考。
396 30
AI Agent 的工程化被低估了
|
2月前
|
人工智能 供应链 安全
MCP Server的五种主流架构与Nacos的选择
本文深入探讨了Model Context Protocol (MCP) 在企业级环境中的部署与管理挑战,详细解析了五种主流MCP架构模式(直连远程、代理连接远程、直连本地、本地代理连接本地、混合模式)的优缺点及适用场景,并结合Nacos服务治理框架,提供了实用的企业级MCP部署指南。通过Nacos MCP Router,实现MCP服务的统一管理和智能路由,助力金融、互联网、制造等行业根据数据安全、性能需求和扩展性要求选择合适架构。文章还展望了MCP在企业落地的关键方向,包括中心化注册、软件供应链控制和安全访问等完整解决方案。
1635 113
MCP Server的五种主流架构与Nacos的选择
|
23天前
|
传感器 人工智能 IDE
通义灵码用户说 | 编程智能体+MCP加持,秒查附近蜜雪冰城
通义灵码现已全面支持Qwen3,新增智能体模式,具备自主决策、环境感知、工具使用等能力,可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换,结合MCP工具与记忆功能,提升开发效率。AI IDE重构编程流程,让开发更智能高效。
303 20
|
21天前
|
人工智能 自然语言处理 关系型数据库
如何构建和调优高可用性的Agent?浅谈阿里云服务领域Agent构建的方法论
本文深入探讨了Agent智能体的概念、技术挑战及实际落地方法,涵盖了从狭义到广义的Agent定义、构建过程中的四大挑战(效果不稳定、规划权衡、领域知识集成、响应速度),并提出了相应的解决方案。文章结合阿里云服务领域的实践经验,总结了Agent构建与调优的完整路径,为推动Agent在To B领域的应用提供了有价值的参考。
283 18
如何构建和调优高可用性的Agent?浅谈阿里云服务领域Agent构建的方法论
|
2月前
|
人工智能 Kubernetes Java
回归开源,两位 Java 和 Go 程序员分享的开源贡献指引
Higress是一个基于Istio和Envoy的云原生API网关,支持AI功能扩展。它通过Go/Rust/JS编写的Wasm插件提供可扩展架构,并包含Node和Java的console模块。Higress起源于阿里巴巴,解决了Tengine配置重载及gRPC/Dubbo负载均衡问题,现已成为阿里云API网关的基础。本文介绍Higress的基本架构、功能(如AI网关、API管理、Ingress流量网关等)、部署方式以及如何参与开源贡献。此外,还提供了有效的开源贡献指南和社区交流信息。
379 33
|
28天前
|
机器学习/深度学习 人工智能 前端开发
AI+Code驱动的M站首页重构实践:从技术债务到智能化开发
本文分享了阿里巴巴找品M站首页重构项目中AI+Code提效的实践经验。面对M站技术栈陈旧、开发效率低下的挑战,我们通过楼层动态化架构重构和AI智能脚手架,实现了70%首页场景的标准化覆盖 + 30%的非标场景的研发提速,开发效率分别提升90%+与40%+。文章详细介绍了楼层模板沉淀、AI辅助代码生成、智能组件复用评估等核心实践,为团队AI工程能力升级提供了可复制的方法论。
195 15
AI+Code驱动的M站首页重构实践:从技术债务到智能化开发
|
14天前
|
人工智能 大数据 开发者
让AI时代的卓越架构触手可及,阿里云技术解决方案开放免费试用
阿里云推出基于场景的解决方案免费试用活动,新老用户均可领取100点试用点,完成部署还可再领最高100点,相当于一年可获得最高200元云资源。覆盖AI、大数据、互联网应用开发等多个领域,支持热门场景如DeepSeek部署、模型微调等,助力企业和开发者快速验证方案并上云。
574 33
让AI时代的卓越架构触手可及,阿里云技术解决方案开放免费试用
|
26天前
|
人工智能 JSON 自然语言处理
Function AI 工作流发布:以 AI 重塑企业流程自动化
本文介绍了基于函数计算 FC 打造的全新 Function AI 工作流服务,该服务结合 AI 技术与流程自动化,实现从传统流程自动化到智能流程自动化的跨越。文章通过内容营销素材生成、内容安全审核和泛企业 VOC 挖掘三个具体场景,展示了 Function AI 工作流的设计、配置及调试过程,并对比了其与传统流程的优势。Function AI 工作流具备可视化、智能性和可扩展性,成为企业智能化转型的重要基础设施,助力企业提升效率、降低成本并增强敏捷响应能力。
386 28