编程简单了,部署依旧很难|Karpathy 演讲的 5 点解读

本文涉及的产品
函数计算FC,每月15万CU 3个月
容器镜像服务 ACR,镜像仓库100个 不限时长
应用实时监控服务-应用监控,每月50GB免费额度
简介: 本文总结了 Andrej Karpathy 在 YC AI Startup School 的分享核心观点,涵盖软件发展的三个阶段、LLM 的定位与挑战、Agent 的产品工程思路以及编程与部署的未来趋势。内容适合 AI 领域从业者参考,强调通过提升工程能力实现 AI 应用的稳定性与可控性。完整视频链接附于文末,便于深入学习。

1.gif


看完了 Andrej Karpathy 在 YC AI Startup School 近 40 分钟的分享,有点意犹未尽。推荐观看完整视频(链接贴在文末阅读原文),没有任何模型架构,也没有任何算法细节,适合 AI 领域的所有从业者,包括 Agent Builder 和 Agent User。我们将一些核心观点进行了延展,并尝试用更易于理解的方式进行表达。


Software



软件 1.0 是“人写代码,机器照做”。我们用 if/else 来定义代码逻辑,告诉计算机每一步怎么干,就像在教一个听话但不会思考的助理。


软件 2.0 是“人给样本,机器自己学”。我们喂数据训练模型,让它自己学怎么做,再对输出进行调试,虽然过程有点黑箱,但效果不错,就像一个模仿能力很强的学徒。


软件 3.0 是“人说目标,机器理解并执行”。我们用自然语言告诉 AI 要做什么,它自己决定怎么做,就像在指挥一个聪明但偶尔出错的助手,我们不用再写具体的代码,而是在“发指令”。


LLM


认同 LLM 是一种新的电力,有基础公共设施的属性。


LLM 不只是建造一个发电厂,像投资晶圆场那样,还需要投入大规模的资金和高精尖人力。


更恰当的比喻是 LLM 是操作系统,并且是一个越来越复杂的软件生态系统,这不仅是大模型自身的多样性所决定的,也受到上下游的开发和部署工具的影响。


Agent



“滑动自治 Autonomy Slider”是获得 Agent 最大输出效果的必备产品工程,通过多轮的提示词和验证等机制,将 LLM 的自治能力纳入可控轨道,而不是让 Agent 完全自主。就像自动驾驶的分级(L1~L5),Agent 允许人在关键时刻“接管方向盘”。


把 Agent 拴在链子上,不要给 Agent 发大而泛的提示词,应是小而具体,输出要有验收逻辑。这不是在弱化 AI,而是在提升其产品稳定性,把 Agent 的行为纳入产品级约束框架中。例如,你提问“教我物理”,这会让 Agent 在森林里迷路,你也无法得到你想要的答案。


不要再尝试回答什么时候实现 AGI,而是提升产品工程和技术工程的质量(关于工程质量,推荐阅读这篇),让用户更易于去使用滑动自治。


Programming



编程越来越简单,但是部署依旧很难,例如要考虑身份安全、访问认证、支付验证等可用性问题,规模级的应用还要准备好可观测等稳定性相关的措施,这些不只是通过代码就能解决的,还依赖上下游的基础设施以及架构设计能力。


传统的基础设施是为人类设计的应用服务的,AI Infra 则应该是为 AI 设计的应用服务。Programning 是用户命令 LLM 做什么,但当前,Engineering 是各个 Vendor 的文档命令用户做什么,这是很大的区别。(🤔:这也许是 AI Infra Builder 们的机会?


阅读原文:https://www.bilibili.com/video/BV1SHKczUEzi/

目录
打赏
0
15
15
3
12924
分享
相关文章
AI Agent 的工程化被低估了
本文探讨了AI应用工程化的关键作用与实现路径,将其分为产品工程和技术工程两大部分。产品工程关注用户体验与交互设计,包括需求建模、UI/UX设计、系统提示词优化及反馈闭环构建,确保AI“能用、好用”。技术工程则聚焦系统稳定性与扩展性,涵盖架构模块化、工具调用机制、流量控制、数据管理及可观测性建设,保障AI应用“快、稳、强”。两者协同决定了AI Agent的实用性与规模化潜力,为行业提供了落地参考。
483 30
AI Agent 的工程化被低估了
MCP Server的五种主流架构与Nacos的选择
本文深入探讨了Model Context Protocol (MCP) 在企业级环境中的部署与管理挑战,详细解析了五种主流MCP架构模式(直连远程、代理连接远程、直连本地、本地代理连接本地、混合模式)的优缺点及适用场景,并结合Nacos服务治理框架,提供了实用的企业级MCP部署指南。通过Nacos MCP Router,实现MCP服务的统一管理和智能路由,助力金融、互联网、制造等行业根据数据安全、性能需求和扩展性要求选择合适架构。文章还展望了MCP在企业落地的关键方向,包括中心化注册、软件供应链控制和安全访问等完整解决方案。
2160 131
MCP Server的五种主流架构与Nacos的选择
通义灵码保姆级教程:从数据读取、清洗、结合大模型分析、可视化、生成报告全链路
本课程通过通义灵码实现零代码数据分析全流程,涵盖数据读取、清洗、可视化、报告生成及内容仿写,无需编程基础,轻松掌握从CSV导入到PDF报告输出的实战技能。
【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型
Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源,拥有卓越的代码和 Agent 能力,在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。
通义灵码用户说 | 编程智能体+MCP加持,秒查附近蜜雪冰城
通义灵码现已全面支持Qwen3,新增智能体模式,具备自主决策、环境感知、工具使用等能力,可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换,结合MCP工具与记忆功能,提升开发效率。AI IDE重构编程流程,让开发更智能高效。
403 20
回归开源,两位 Java 和 Go 程序员分享的开源贡献指引
Higress是一个基于Istio和Envoy的云原生API网关,支持AI功能扩展。它通过Go/Rust/JS编写的Wasm插件提供可扩展架构,并包含Node和Java的console模块。Higress起源于阿里巴巴,解决了Tengine配置重载及gRPC/Dubbo负载均衡问题,现已成为阿里云API网关的基础。本文介绍Higress的基本架构、功能(如AI网关、API管理、Ingress流量网关等)、部署方式以及如何参与开源贡献。此外,还提供了有效的开源贡献指南和社区交流信息。
465 34
数据库+MCP,0编码自主完成数据洞察
本文介绍了一种全新的数据分析方案,结合PolarDB MySQL版与阿里云百炼,搭配MCP工具实现智能数据库分析应用。该方案解决传统数据分析工具高门槛、低效率的问题,通过零SQL操作和一站式部署,助力企业快速挖掘数据价值。方案具备高性能查询、快响应直连加速、高安全保障及易迁移上云等优势,并详细说明了部署资源、应用配置及验证步骤,帮助用户轻松完成实践体验。
AI+Code驱动的M站首页重构实践:从技术债务到智能化开发
本文分享了阿里巴巴找品M站首页重构项目中AI+Code提效的实践经验。面对M站技术栈陈旧、开发效率低下的挑战,我们通过楼层动态化架构重构和AI智能脚手架,实现了70%首页场景的标准化覆盖 + 30%的非标场景的研发提速,开发效率分别提升90%+与40%+。文章详细介绍了楼层模板沉淀、AI辅助代码生成、智能组件复用评估等核心实践,为团队AI工程能力升级提供了可复制的方法论。
243 15
AI+Code驱动的M站首页重构实践:从技术债务到智能化开发
让AI时代的卓越架构触手可及,阿里云技术解决方案开放免费试用
阿里云推出基于场景的解决方案免费试用活动,新老用户均可领取100点试用点,完成部署还可再领最高100点,相当于一年可获得最高200元云资源。覆盖AI、大数据、互联网应用开发等多个领域,支持热门场景如DeepSeek部署、模型微调等,助力企业和开发者快速验证方案并上云。
2483 111
让AI时代的卓越架构触手可及,阿里云技术解决方案开放免费试用
MSE Nacos Controller:为 Kubernetes 生态构建配置管理与服务发现的桥梁
在企业云原生转型过程中,如何实现传统微服务与 Kubernetes 服务的配置统一管理、服务互通及协议转换成为关键挑战。MSE Nacos Controller 应运而生,作为连接 Kubernetes 与 Nacos 的桥梁,支持 ConfigMap 与 Nacos 配置双向同步、服务自动注册发现,并助力 Higress 等 MCP 网关实现 REST API 向 AI 可调用 MCP 服务的转换,全面提升系统治理能力与智能化水平。
153 31

云原生

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等