
导读:系统梳理 AI 迈向自主行动的技术演进与产业脉络,探索迈向 ASI 的路径。
文/ 阿里云研究院
AGI 并非终点,而是通往 ASI 的起点。在迈向超级人工智能(ASI)的征程中,阿里巴巴集团CEO吴泳铭将其清晰划分为智能涌现、自主行动、自我迭代三个演进阶段,当前正处于承上启下的自主行动阶段。
回溯 AI 发展进程,智能涌现阶段为迈向 ASI 奠定了基础。大模型的问世标志着一个里程碑式的突破,它使 AI 摆脱传统任务局限,具备认知理解、内容生成与逻辑推理的通用智能基础,为 ASI 征程搭建了认知底座,也为进入自主行动阶段做好了铺垫。
如今我们正处在 AI 自主行动的阶段:在智能涌现的基础上,AI 从感知与生成加速迈向决策与行动。智能体技术 体系推动 AI 能力升级,实现了从被动响应指令到主动感知环境、规划任务、调用工具的本质性转变,也重构了人机协作模式。与此同时,AI 正突破虚拟边界,以机器人、智能汽车、智能硬件等形态为载体,深度融入生产制造、 公共服务、日常生活等真实物理场景。AI 的自主行动使得技术能力真正落地成为真实场景中的实践价值,也成为 AI 从智能涌现到实现自我迭代的关键桥梁。
这一阶段的到来,驱动了技术、应用、产业的系统性革新:技术层面,推动底层算力、模型、架构持续突破,构建更坚实的 AI 发展底座;应用层面,催生软件生态与硬件形态的创新,拓展AI赋能的场景边界;产业层面,将重塑产业结构、商业规则及全球创新协同模式,为经济社会高质量发展注入新动能。
本文基于 2025 年云栖大会所呈现的全景趋势与核心亮点,系统梳理AI迈向自主行动的技术演进与产业脉络, 一方面呈现当前发展阶段的关键特征,更试图探寻这一阶段如何为 AI 最终迈向自我迭代的 ASI 目标铺路,共同见证 AI 开启更广阔发展图景的重要进程。
技术突破:构筑 AI 发展的底层能力
技术能力的持续突破是 AI 价值释放的基础,通过构建算力基座、基础模型、开发体系、技术生态等关键要素,结合软硬件协同演进,为 AI 应用提供稳定、高效和可扩展的技术支撑,解决从技术研发到落地应用的核心痛点。
云智一体持续深化:打造 AI 云全栈技术生态
云计算与 AI 的深度融合,正构建从底层硬件到上层应用的全栈技术生态,是破解 AI 规模化落地资源与成本瓶颈的关键。云计算的核心优势在于其异构算力池化能力,能将 CPU、GPU、TPU 等不同类型的算力资源整合为统一资源池,根据 AI 任务的实时需求动态分配算力,避免单一算力资源闲置或过载的问题,形成了弹性可扩展的算力底座。同时,云计算可以支撑训推一体化落地,通过统一的平台实现模型训练、推理、优化、部署的全流程衔接,无需在不同系统间反复迁移数据与模型,缩短从技术研发到应用落地的周期。

全栈 AI 云基于弹性可扩展的算力底座,向上整合了数据管理、模型训练及推理与应用开发的全流程服务:数据管理层面,可实现多源异构数据接入、自动化清洗标注与合规存储调度,为 AI 提供高质量数据支撑:模型训练及推理层面,能动态匹配算力资源、提供优化工具链与多场景推理方案,高效推进模型从研发到实用;应用开发层面,通过开发平台与工具链、API 接口与行业模板,助力企业快速构建并集成 AI 应用。云智一体全栈 AI 能力极大地降低了 AI 开发与部署的门槛,使得企业无需投入巨额硬件成本,即可按需使用算力资源与开发工具链,从而将重心聚焦于业务创新本身。
大模型技术突破:拓宽 AI 应用的能力边界
当前,大型模型的能力边界正处于不断扩展之中。一方面,模型从单一模态向多模态融合演进。多模态大模型能够协同处理文本、图像、音频、视频乃至 3D 信息,这种跨模态的理解与生成能力使其更加贴合人类的认知方式,极大地拓宽了 AI 的应用场景,例如在教育领域,多模态大模型可将课本上文本知识转化为视频动画与语音讲解,使学生能以更为直观生动的方式掌握知识点;在医疗领域,多模态大模型能够综合分析患者的 CT 影像、病历文本与问诊语音,辅助医生更全面地判断病情。
另一方面,大模型通过技术创新优化并提升核心能力:通过引入基于人类反馈的强化学习(RLHF)等技术,模型能在与环境的交互中不断优化策略,增强复杂任务推理与规划能力,例如在物流调度场景中,模型可根据实时路况、订单量、车辆状态动态调整配送路线,而非依赖预置规则或算法。同时,结合领域知识,通过在后训练过程中融入行业数据与规则,显著提升通用大模型在垂直场景的适应性与专业性:如金融领域的大模型融入风控规则与市场数据后,能更精准地识别信贷风险;工业领域的大模型结合设备运维知识,可提前预测设备故障。这些突破正推动大模型从被动响应人类指令转向主动求解复杂问题,成为 AI 自主行动的核心技术支撑。
开发范式与架构升级:重构 AI 应用的运行体系
智能体技术兴起,正重塑 AI 时代应用开发范式。任务规划与执行已从预定义静态流程编排,转向模型自主分解任务、动态决策的智能化模式。同时,智能记忆可贯通上下文、动态适配不同用户,兼具从历史记录到个性生成的分层能力与多模态存储功能;信息增强机制通过接入本地知识、领域数据与实时信息,提升智能体的准确性与专业性。依托此范式,智能体可实现从“Chat”到“Action”的跨越,通过调用各类工具和服务,与真实环境交互完成任务并实现自我进化。阿里云百炼平台全面覆盖规划决策、信息管理、工具调用等关键开发环节,推出 ModelStudio-ADK 与 ADP 高低代码双引擎架构,打通智能体从开发、部署到商业化的全链路。此外,Qwen-Coder 编程大模型可实现代码生成补全、复杂编程任务调试,助力开发者高效开发。
应用架构也正向 AI 原生阶段演进。AI 原生应用架构的目标,是在满足可扩展、可观测、安全合规的基础上,依托全新架构范式实现应用的 “智能思考与行动”,最大化释放大模型的智能潜力。AI 原生应用架构的核心在于系统性地组织与大模型的交互,将模型的认知潜力转化为稳定、可靠且可进化的应用能力,典型架构包含 API 网关、AI 网关、云原生服务管理平台、AI 观测和评估、事件驱动架构及工具集等模块,目前已初步形成以“大模型为核心、Agent 为执行单元、工具链为延伸能力”的智能系统框架。未来,AI 原生应用架构将突破现有能力集成调用的局限,进一步向具备自主性、演化性与环境感知能力的方向发展,持续完善智能应用的架构支撑体系。
开源开放生态协同:降低 AI 技术资源门槛
开源开放是推动 AI 技术普惠化与创新加速的关键力量。它通过构建创新协同网络,打破技术垄断与资源壁垒,让不同规模的企业、开发者都能获取高质量的 AI 技术与资源。阿里云作为国内率先布局自研大模型开源的企业之一,持续推进“全尺寸、全模态、多场景”的开源策略,迄今已贡献300余款开源模型,覆盖文本、图片、语音、视频、推理、代码等多个领域,通义千问衍生模型超 14 万个,开发者可基于开源模型快速进行二次开发,大幅降低研发成本。
魔搭社区则成为中国特色开源生态的标杆,目前已汇聚1600 万开发者与 7 万个模型。企业、科研团队和开发者均可在魔搭社区获取开源模型与工具、寻找适配的技术解决方案、发布最新成果并获取实践反馈。多家企业依托通义开源模型,在营销、客服、游戏、教育等多个领域进行垂直模型开发;中国科学院等多家科研机构,也已相继接入通义千问开源模型,其中国家天文台基于 QwQ-32B 模型打造出用于太阳耀斑分析与预测的金乌大模型。开源开放不仅降低 AI 技术门槛,更可推动形成多元协同创新生态,让创新力量从头部企业延伸至中小企业、科研机构与开发者,加速 AI 技术的迭代与落地。
应用创新:开拓 AI 赋能的多元场景
智能体技术重塑软件生态新格局,具身智能引领硬件革命新方向。基于应用的创新,AI 完成从技术创新到实际应用的关键跨越,让智能价值真正融入到生产与生活。
智能体重构软件生态:AI 革新数字世界的运行模式
AI 已超越工具辅助属性,正演进为重塑数字生产力的核心力量,而智能体(Agent)的融入则彻底改变软件生态的运行模式。具备自主决策与执行能力的智能体逐渐深度融入真实业务流与数据流的数字伙伴。例如在电商的采购业务里,智能体能够实时抓取业务数据,自主分析备货需求、筛选优质供应商并完成询价筛选,生成并下达采购订单,全程融入业务流并自主执行。智能体打破了传统软件被动响应、流程固化的模式,通过“感知 - 决策 - 执行”的闭环,实现对复杂业务流程的动态理解、优化和自适应执行。这种深度融合不仅重构数字世界运行模式,更驱动着生产关系的革新:
●在决策机制上,人类思考与 AI 分析形成互补:企业管理者设定战略目标,智能体则通过分析海量数据生成多套执行方案,并预测各方案的风险与收益,提升决策的 科学性与前瞻性;
●在业务流程上,人机协作重塑分工模式:智能体承担 数据处理、任务执行等重复性工作,人类专注于战略规划、创意设计、价值判断等高价值工作,例如在内容创作领域,智能体可自动整理素材、生成初稿,创作者则聚焦于内容优化与价值提升,显著提升运行效率;
●在组织架构上,多智能体自主协同打破部门壁垒:企业内部的研发、生产、销售智能体可实时共享数据,例如研发智能体发布新产品设计后,生产智能体可自动规划生产线调整,销售智能体同步启动市场调研,通过自主完成跨部门、跨领域的流程流转与协作,催生更加扁平、灵活、敏捷的组织形态。
具身智能引领硬件革命:AI 向物理世界的能力跨越
AI 正突破虚拟边界实现关键能力跃迁,通过环境理解、 自主决策与任务执行的能力,以智能硬件、智能驾驶汽车、机器人等为载体融入物理场景。它通过传感器感知物理世界信息,结合 AI 算法解析场景需求,再依托硬件载体执行任务,构建“感知 - 决策 - 执行”闭环,推动硬件设备从被动功能执行向主动自主行动进化。这场从数字智能到具身智能的跨越,让 AI 成为物理世界中不可或缺的参与者与执行者,重构人与硬件设备的交互逻辑。
●智能硬件:手机 /PC、AR/VR、穿戴设备等硬件终端演进为具备情境感知与主动服务的智能伙伴,提供个性化的沉浸式体验,例如 AI 眼镜可实时识别用户视野中的物体并提供信息讲解,AI PC 能根据用户工作场景自动切换性能模式,智能家居系统可通过分析用户行为习惯,主动调节室内温度、灯光与家电状态。
●智能驾驶汽车:通过多传感器融合,并借助大模型强大的环境认知与实时决策能力,智能驾驶系统能够应对更加复杂多变的长尾场景,提升复杂场景认知能力,实时调整车速与路线,提升决策响应速度。
●工业与服务机器人:通过融合大模型,机器人的环境感知、任务拆解和灵巧操作能力得到大幅提升,不仅能完成更精密的操作,还能实现更自然安全的人机交互和协作。
产业升级:AI 驱动智能化、全球化与负责任发展
AI 已超越工具属性,成为重塑产业格局的核心变量。国务院《关于深入实施“人工智能 +”行动的意见》明确要求推动人工智能与经济社会各行业各领域广泛深度融合。AI 在推动智能化升级、深化全球协同、催生创新生态的同时,也需要构建负责任的发展框架,助力开创更具包容性、可持续性的新阶段。
全场景智能化升级:AI 重塑产业运行与消费体验
从企业端的业务流程重构,到消费端交互体验升级,AI 成为推动各行业各领域智能化发展的核心力量。
在企业层面,AI 正从单点辅助转向系统智能,全面渗透到研发、生产、供应链和服务等环节。例如,在研发阶段,药企利用大模型模拟药物分子与靶点的相互作用,加速潜在药物筛选,缩短研发周期;生产过程中,食品企业通过 AI 驱动的视觉检测系统,实现产品瑕疵的高速精准识别,提升质量控制水平;供应链管理中,零售企业运用大模型分析消费数据,精准预测需求,优化库存布局,降低成本;服务领域,旅游企业借助智能体提供个性化旅行方案,结合实时信息调整行程,增强用户体验。这些不仅提升产业效率,更重构产业价值创造模式。
面向消费者,AI 从被动响应转变为主动服务,提供更加个性化的体验。如在衣着造型方面,根据用户体型和偏好推荐穿搭方案;个人健康管理上,智能设备分析用户的健康数据,定制健身和睡眠改善计划;智能家居场景下,整合设备数据自动调节室内环境参数,适应家庭成员的生活习惯;日常出行时,智能系统基于路况和个人日程提前规划最优路线。这些应用共同促进了更高效、便捷的生活方式。
全球化协同创新:AI 加速创新能力的全球扩散
AI 正加速全球流动与共享,打破地域限制,推动全球产业分工重构与创新资源优化。这一进程并非简单的技术转移,而是 AI 创新能力的全球扩散与协同创造。不同国家、企业、科研机构基于自身优势,在产业链中承担不同角色,形成互补共赢的创新网络。而 AI 云作为全球创新数字基座,发挥着关键支撑作用:它通过统一的平台实现全球数据、模型、工具的共享,让分布在不同地区的创新主体能实时协作。
从实践来看,全球创新呈现多元协同态势:跨国企业依托 AI 云平台构建分布式研发和运营网络,实现数据的实时共享与协同,显著提升业务效率;出海企业则借助 AI 云的能力与当地市场需求深度融合,通过适应当地环境与场景优化系统功能,有效赋能本土产业与社会发展。这种全球化协同创新,让创新资源突破地域限制,实现最优配置,推动 AI 技术更快迭代,同时也让更多地区享受到智能化变革带来的红利。
TA 力量创新生态繁荣:AI 激活多元创新主体
云和 AI 技术的普及,正显著降低创新创业门槛,推动创新主体从科技巨头走向多元生态。在技术层面,一站式大模型服务平台提供预置模型与开发工具,开发者无需从零构建模型,即可快速开发 AI 应用;低代码 / 无代码开发平台通过可视化拖拽组件,让非技术人员也能参与 AI 应用搭建;AI 编程工具能自动生成代码、排查错误,提升开发效率。在资源层面,开源社区、共创平台和孵化器打破壁垒——开源社区提供免费的模型与技术文档,共创平台连接需求方与技术方,孵化器则为初创企业提供资金、场地与技术指导。
这种环境下,创新主体呈现多元化趋势:中小企业借助低成本技术资源,得以快速推出贴合细分场景的 AI 产品,精准满足特定领域的需求;个人开发者凭借 AI 工具实现创意高效落地,并在开源社区积极发布应用,与全球开发者交流迭代。这其中年轻人和女性凭借更新鲜和更细腻的视角开辟创新路径,拓展 AI 的应用边界。多元化的创新生态成为推动 AI 在各行各业落地的活跃且充满活力的重要力量,让 AI 创新不再局限于专业技术领域,而是融入更多元的视角与需求,推动 AI 应用更贴近生活、更具包容性。
AI 向善,治理为基:保障 AI 可持续发展
AI 早已脱离实验室的范畴,深度融入千行百业,不仅重塑全球经济结构、社会运行方式,更在拓展人类的认知边界。技术加速的背后,阿里云智能集团首席战略官郑俊芳指出,更需明确“技术越强大,责任越重大”——“AI 向善”为核心价值目标,稳健治理体系则是其实现的必要保障。
AI 的正向价值已在多领域落地:医疗领域支撑精准诊疗,教育领域推动资源普惠,科研领域加速前沿突破,能源领域助力双碳目标。阿里云创始人、之江实验室主任王坚院士更界定 AI 本质:“AI 不是替代谁,而是帮助谁”。他以“医生价值在于诊疗”为喻,强调 AI 价值应聚焦实际赋能,并援引图灵观点称 AI 是时代“纸与笔”,虽不替代大脑,却为创造力落地提供支撑,这也与吴泳铭“AI 越强大,人类更强大”的论断高度契合。
而 AI 发展过程中面临的数据隐私泄露、算法偏见、技术滥用等挑战,则需依托治理破解。郑俊芳指出,全球 AI 治理是行业发展的保障轨道,而非创新约束,倡导以 “战略远见、务实行动、开放心态”构建“负责任 AI 全球路线图”。具体举措包括健全伦理规范、强化技术安全防护、建立高风险场景防控监管机制等,形成可控可信体系。

结语
正如本次云栖大会所呈现的,AI 迈向自主行动的进程正在加速,技术突破构筑了能力基石,应用创新开拓了价值空间,而产业升级则为经济社会的高质量发展注入了新动能,AI 正在推动技术、应用和产业的系统性革新。面向未来,唯有坚持技术发展与治理建设同步、创新活力与责任担当并重,方能推动社会的全面智能化转型,AI 负责任发展需产业、学术、政府及公众的多方协同。 当前形成的共识与标准,将成为人机协同“底层协议”;未来以治理为保障、技术为驱动、责任为导向,方能实现“AI 解放人类潜能、共创无限可能”的可持续发展目标。创造更加高效、普惠和美好的未来社会。