智能体构建:打破停机瓶颈:智能体Skill热更新、灰度发布与回滚机制全流程指南.142

简介: 本文详解大模型智能体的Skill热更新与灰度发布体系:将业务逻辑封装为独立Skill模块,通过SkillRegistry注册中心、DynamicLoader动态加载、GrayRouter灰度路由等组件,实现不停服更新、小范围验证、一键回滚,保障金融/政务等场景7×24高可用。

一、核心概念

1. 基础定义

1.1 大模型智能体

       智能体是基于大模型驱动、具备自主执行能力的业务服务系统,区别于个人版聊天助手,它承载金融客服、政务审批、工业调度、医疗辅助等核心业务,要求7×24 小时不间断运行、零业务中断、高稳定性、可追溯、可管控。

       这类智能体的核心能力由一个个Skill技能承载,比如:金融智能体的“账单查询 Skill、风险预警 Skill”,政务智能体的“证照办理Skill、政策解读Skill”。

142.2-智能体Skill热更新、灰度发布.png

1.2 Skill技能

       Skill是大模型智能体的最小功能模块,是智能体的核心执行单元,本质是封装了业务逻辑、大模型调用规则、工具接口(数据库、API、文件系统)的可执行代码或配置。

  • 一个智能体 = 多个Skill 组合;
  • 新增功能 = 新增Skill;
  • 修复问题 = 修改现有Skill;
  • 下线功能 = 删除无用Skill。

       传统架构中,Skill与智能体核心服务强绑定,修改任意Skill必须重启整个系统,直接导致业务中断。

1.3 Skill 热更新

       不停服的动态更新,热更新是不重启智能体核心服务、不中断用户请求,仅对目标Skill进行加载、修改、卸载的技术。

核心价值:更新期间,用户无感知、业务零中断,完全满足金融、工业、政务等场景的高可用要求。

1.4 灰度发布

       灰度发布是将更新后的 Skill 先定向推送给少量指定用户,即通常我们所说的灰度用户,运行一段时间后,监控成功率、响应时间、错误率等指标,确认无异常再全量发布给所有用户,优先小范围验证,规避全量风险。

核心价值:避免新Skill存在 Bug 导致全量用户业务故障,实现安全更新。

1.5 技能回滚

       回滚是当新发布的Skill出现异常时,一键切换回历史稳定版本,且不影响其他Skill运行,从而实现快速止损,保障稳定性。

核心价值:更新出问题时,快速恢复服务,将业务影响降到最低。

142.3-企业级智能体高可用工程能力对比 ability_radar_compare.png

2. 应用价值

2.1 传统智能体的致命短板

  • 更新必停机:修改1个小 Bug,需重启整个系统,政务、金融场景停机1分钟可能造成数十万损失;
  • 全量更新风险高:新功能直接推给所有用户,一旦出错,全员受影响;
  • 无应急回滚能力:更新失败后,只能回退代码再重启,耗时久、影响大;
  • 无法适配企业级需求:高可用、高稳定性、可管控性不达标。

2.2 Skill 热更新 + 灰度发布的核心价值

  • 高可用:7×24 小时不间断运行,更新零停机;
  • 高安全:灰度验证,全量发布无风险;
  • 高灵活:单Skill独立更新或回滚,不影响其他功能;
  • 可观测:全流程监控,更新状态可追溯;
  • 通用迁移:脱离医疗场景后,适配所有企业级智能体。

142.4-Skill热更新能力对比 update_compare.png

3. 对大模型的意义

       大模型是智能体的大脑,负责理解用户意图、生成执行指令;Skill是智能体的手脚,负责落地执行具体业务。

  • 解耦大模型核心与业务逻辑:大模型服务无需重启,仅更新业务Skill,保护大模型核心服务稳定性;
  • 提升大模型落地效率:业务需求快速迭代,无需等待系统重启,缩短上线周期;
  • 增强大模型可靠性:灰度 + 回滚机制,避免业务 Bug 影响大模型核心服务;
  • 实现企业级工程化:让大模型的应用场景逐步深化,演变成生产级的核心系统,满足严苛行业要求。

二、基础原理

1. 核心架构原理

       Skill热更新与灰度发布的核心原理是“分层解耦 + 动态注册 + 策略路由”,简单说就是解耦与动态管理,整体架构分为 4 层:

  • 1. 接入层:接收用户请求,解析用户身份,是否灰度用户;
  • 2. 路由层:根据灰度策略,将请求分发到对应版本的Skill;
  • 3. Skill注册中心:统一管理所有Skill的版本、状态、配置;
  • 4. 执行层:加载运行Skill,调用大模型与工具接口。

142.5-Skill热更新灰度发布架构.png

核心原理:

       智能体核心服务只保留“请求接收、路由调度、监控上报”能力,Skill作为独立模块动态加载到内存,而非编译绑定在核心服务中。更新时,仅替换内存中的Skill模块,核心服务不中断。

2. 核心组件详解

2.1 SkillRegistry 技能注册中心:核心大脑

  • 作用:统一存储、管理所有Skill的元数据,包括名称、版本、路径、依赖、灰度策略;
  • 功能:Skill的注册、注销、查询、版本管理;
  • 技术细节:基于内存 + 持久化存储(Redis/MySQL)实现,支持高并发查询,支持热加载监听。

2.2 DynamicLoader 动态加载器:热更新执行单元

  • 作用:从文件或仓库中加载 Skill 代码到内存,卸载旧版本Skill;
  • 技术细节:支持 Python importlib、Java ClassLoader等动态加载机制,支持沙箱隔离,避免Skill之间相互影响。

2.3 GrayRouter 灰度路由器:灰度分发核心

  • 作用:根据用户 ID、部门、区域等规则,匹配灰度策略,分发请求;
  • 技术细节:支持白名单、百分比、标签三种灰度模式,规则实时生效,无需重启。

2.4 Monitor 监控器:发布决策依据

  • 作用:实时采集Skill的运行指标,如成功率、响应时间、错误率、大模型调用耗时;
  • 技术细节:指标上报到 Prometheus/Grafana,异常自动告警,支持灰度自动终止或回滚。

2.5 VersionControl 版本控制器:回滚核心

  • 作用:存储Skill的所有历史版本,记录版本变更日志;
  • 技术细节:版本号递增管理,回滚时直接加载历史版本,秒级生效。

三、执行流程

       该流程实现Skill的平滑升级:新Skill独立开发注册后,通过白名单、百分比或标签配置灰度规则,在小范围用户中运行并监控成功率与响应时间。达标则全量发布,异常则自动回滚至历史版本,保障服务稳定性。

142.6-Skill的平滑升级流程 deepseek_mermaid_20260407_73c0e3.png

流程说明:

步骤 1:Skill 开发与打包

  • 开发者编写新Skill、修改旧Skill,完成测试后,打包为独立模块(.py/.json 配置文件),上传到Skill仓库。
  • 关键:Skill必须独立无耦合,不依赖智能体核心服务内存数据。

步骤 2:Skill 注册与版本录入

  • 将新Skill信息(名称、版本、路径、灰度规则)录入SkillRegistry,注册中心标记为“待发布"状态。
  • 技术细节:版本号遵循"主版本.次版本.修订号",如 1.0.0→1.0.1,自动关联历史版本。

步骤 3:灰度发布配置

管理员配置灰度规则:

  • 模式 1:白名单,指定用户ID、部门;
  • 模式 2:百分比,如10%的用户;
  • 模式 3:标签,政务内网用户、金融VIP用户。
    配置完成后,GrayRouter实时加载规则。

步骤 4:灰度运行与监控

  • 灰度用户请求进入系统→路由层匹配规则→分发到新 Skill→Monitor 实时采集指标。
  • 判断标准:连续5分钟成功率 100%、响应时间≤500ms、无错误→可全量发布;若出现异常→自动触发回滚。

步骤 5:全量发布/异常回滚

  • 全量发布:关闭灰度规则,所有用户请求路由到新Skill;
  • 异常回滚:路由层切回历史版本Skill,卸载新Skill,标记异常并记录日志。

142.7-灰度发布全流程风险与稳定性变化 gray_risk.png

四、应用实践

1. 完整的项目结构

skill_agent_hotupdate/

├── main.py                           # 主入口:执行热更新、灰度、回滚全流程

├── requirements.txt              # 项目依赖清单

├── skills/                               # 所有技能 Skill 存放目录(热更新核心目录)

│   ├── bill_query_v1_0_0.py   # 账单查询技能 - 稳定旧版本

│   └── bill_query_v1_0_1.py   # 账单查询技能 - 待灰度新版本

├── core/                                # 核心架构模块

│   ├── __init__.py

│   ├── skill_registry.py           # Skill 注册中心 SkillRegistry

│   ├── dynamic_loader.py     # 动态加载器(热更新核心)

│   ├── gray_router.py            # 灰度路由策略

│   ├── monitor.py                  # 技能运行指标监控

│   └── rollback.py                 # 版本回滚管理器

├── config/                             # 配置文件

│   ├── __init__.py

│   └── redis_config.py          # Redis 连接配置

└── logs/                                # 运行日志、发布记录、回滚记录(自动生成)

   ├── skill_metrics.log

   └── rollback_history.log

2. 文件完整代码

2.1 requirements.txt

redis>=5.0.0

psutil>=5.9.0

matplotlib>=3.7.0

2.2 主入口 main.py

整合所有模块,执行:注册 Skill → 热加载 → 灰度路由 → 监控 → 全量发布 → 模拟回滚。

142.8-整合所有模块执行流程 deepseek_mermaid_20260407_825b6f.png

# 主入口:Skill 热更新 + 灰度发布 + 回滚全流程演示
from core.skill_registry import SkillRegistry
from core.dynamic_loader import DynamicLoader
from core.gray_router import GrayRouter
from core.monitor import SkillMonitor
from core.rollback import RollbackManager
if __name__ == "__main__":
    print("=" * 60)
    print("🔥 企业级智能体 Skill 热更新与灰度发布系统启动")
    print("=" * 60)
    # ====================== 0. 初始版本调用测试 ======================
    print("\n📌 步骤0:初始版本调用测试(更新前)")
    DynamicLoader.load_skill("bill_query", "./skills/bill_query_v1_0_0.py")
    import sys
    if "bill_query_v1_0_0" in sys.modules:
        old_skill = sys.modules["bill_query_v1_0_0"]
        print("[初始版本 v1.0.0] 调用结果:", old_skill.execute("user_test"))
    # ====================== 1. 注册新版本 Skill(灰度模式)======================
    print("\n📌 步骤1:注册新版本 Skill(灰度发布中)")
    SkillRegistry.register_skill(
        skill_name="bill_query",
        version="1.0.1",
        path="./skills/bill_query_v1_0_1.py",
        gray_users=["user001", "user002", "admin001"]
    )
    # ====================== 2. 热加载新版本 Skill ======================
    print("\n📌 步骤2:动态热加载 Skill(不停服)")
    DynamicLoader.load_skill("bill_query", "./skills/bill_query_v1_0_1.py")
    # ====================== 3. 灰度路由测试 ======================
    print("\n📌 步骤3:灰度路由分发测试")
    # 灰度用户 → 新版本
    print("[灰度用户] user001 →", GrayRouter.route_skill("bill_query", "user001"))
    # 普通用户 → 旧版本
    print("[普通用户] user003 →", GrayRouter.route_skill("bill_query", "user003"))
    # ====================== 4. 监控指标采集 ======================
    print("\n📌 步骤4:实时监控 Skill 运行指标")
    SkillMonitor.collect_metrics("bill_query")
    # ====================== 5. 灰度通过 → 全量发布 ======================
    print("\n" + "="*50)
    print("✅ 灰度验证无异常,执行全量发布")
    print("="*50)
    SkillRegistry.update_skill_status("bill_query", "online")
    # ====================== 6. 模拟异常 → 一键回滚 ======================
    print("\n" + "="*50)
    print("⚠️  模拟新版本异常,触发自动回滚")
    print("="*50)
    RollbackManager.rollback_skill("bill_query", old_version="1_0_0")
    # ====================== 7. 回滚后验证 ======================
    print("\n📌 步骤7:回滚后验证 - 调用不同版本Skill")
    
    # 重新加载旧版本
    DynamicLoader.load_skill("bill_query", "./skills/bill_query_v1_0_0.py")
    
    # 动态导入并执行
    import sys
    if "bill_query_v1_0_0" in sys.modules:
        old_skill = sys.modules["bill_query_v1_0_0"]
        print("[回滚后-旧版本 v1.0.0] 调用结果:", old_skill.execute("user_test"))
    
    if "bill_query_v1_0_1" in sys.modules:
        new_skill = sys.modules["bill_query_v1_0_1"]
        print("[新版本 v1.0.1] 调用结果:", new_skill.execute("user_test"))
    
    # 验证当前路由
    print("\n📌 回滚后路由验证:")
    print("[任意用户] user001 →", GrayRouter.route_skill("bill_query", "user001"))
    print("\n" + "="*60)
    print("🎯 全流程执行完成:热更新 → 灰度 → 全量 → 回滚 → 验证")
    print("="*60)

image.gif

2.3 Redis连接配置:config/redis_config.py

统一管理 Redis、端口、灰度策略阈值等,便于生产环境修改。

# Redis 统一配置
import redis
def get_redis_client():
    """获取 Redis 连接客户端(单例模式)"""
    try:
        client = redis.Redis(
            host="localhost",
            port=6379,
            db=0,
            decode_responses=True,
            socket_connect_timeout=3
        )
        # 测试连接
        client.ping()
        return client
    except Exception as e:
        raise Exception(f"Redis 连接失败,请启动 Redis 服务:{str(e)}")
# 全局 Redis 客户端
redis_client = get_redis_client()

image.gif

2.4 Skill注册中心:core/skill_registry.py

Skill注册中心:版本管理、状态管理、元数据存储

import json
from config.redis_config import redis_client
class SkillRegistry:
    """技能注册与元数据管理中心"""
    @staticmethod
    def register_skill(skill_name: str, version: str, path: str, gray_users: list = None):
        """注册/更新技能信息"""
        skill_data = {
            "version": version,
            "path": path,
            "gray_users": gray_users or [],
            "status": "gray",  # gray=灰度, online=全量, offline=下线
            "update_time": __import__('time').time()
        }
        redis_client.set(f"skill:{skill_name}", json.dumps(skill_data))
    @staticmethod
    def get_skill_info(skill_name: str):
        """获取技能详情"""
        data = redis_client.get(f"skill:{skill_name}")
        return json.loads(data) if data else None
    @staticmethod
    def update_skill_status(skill_name: str, status: str):
        """更新技能发布状态"""
        info = SkillRegistry.get_skill_info(skill_name)
        if info:
            info["status"] = status
            redis_client.set(f"skill:{skill_name}", json.dumps(info))
            print(f"🔄 技能【{skill_name}】状态已更新:{status}")
            # 输出当前版本调用测试
            import sys
            import os
            current_path = info.get("path", "")
            module_name = os.path.basename(current_path).replace(".py", "")
            if module_name in sys.modules:
                skill_module = sys.modules[module_name]
                if hasattr(skill_module, "execute"):
                    print(f"📌 当前版本调用测试: {skill_module.execute('test_user')}")

image.gif

2.5 热更新核心:core/dynamic_loader.py

动态加载器:动态importlib重载,实现Skill热更新,不停服重载

import importlib
import sys
import os
class DynamicLoader:
    """技能热加载核心模块"""
    @staticmethod
    def load_skill(skill_name: str, skill_path: str):
        """动态加载/重载技能模块"""
        try:
            # 添加技能目录到系统路径
            base_dir = os.path.dirname(skill_path)
            if base_dir not in sys.path:
                sys.path.append(base_dir)
            # 获取模块名
            module_file = os.path.basename(skill_path)
            module_name = module_file.replace(".py", "")
            # 加载/重载(热更新关键)
            if module_name in sys.modules:
                importlib.reload(sys.modules[module_name])
            else:
                importlib.import_module(module_name)
            print(f"✅ 技能【{skill_name}】热加载成功:{skill_path}")
            return True
        except Exception as e:
            print(f"❌ 技能【{skill_name}】加载失败:{str(e)}")
            return False
    @staticmethod
    def unload_skill(skill_name: str):
        """从内存卸载技能"""
        print(f"🗑️  技能【{skill_name}】已从运行内存卸载")

image.gif

2.6 灰度路由:core/gray_router.py

灰度路由器:根据用户身份分配版本

from core.skill_registry import SkillRegistry
class GrayRouter:
    """请求路由:灰度用户/普通用户分发"""
    @staticmethod
    def is_gray_user(user_id: str, gray_list: list) -> bool:
        """判断是否为灰度用户"""
        return user_id in gray_list
    @staticmethod
    def route_skill(skill_name: str, user_id: str) -> str:
        """路由到对应版本的技能路径"""
        skill_info = SkillRegistry.get_skill_info(skill_name)
        if not skill_info:
            raise Exception(f"技能【{skill_name}】未注册")
        # 灰度模式:仅灰度用户使用新版本
        if skill_info["status"] == "gray":
            if GrayRouter.is_gray_user(user_id, skill_info["gray_users"]):
                return f"路由到【新版本 {skill_info['version']}】"
            else:
                return "路由到【稳定旧版本 v1.0.0】"
        # 全量模式:所有用户使用新版本
        elif skill_info["status"] == "online":
            return f"路由到【全量版本 {skill_info['version']}】"
        else:
            return "⚠️  技能已下线"

image.gif

2.7 监控:core/monitor.py

技能监控:采集成功率、响应时间、错误率

import time
import psutil
from datetime import datetime
class SkillMonitor:
    """实时监控技能运行质量指标"""
    @staticmethod
    def collect_metrics(skill_name: str):
        """采集并输出监控指标(企业版可接入 Prometheus)"""
        metrics = {
            "skill": skill_name,
            "success_rate": "100%",
            "response_time": "0.28s",
            "error_rate": "0%",
            "cpu_usage": f"{psutil.cpu_percent(interval=0.1)}%",
            "time": datetime.now().strftime("%Y-%m-%d %H:%M:%S")
        }
        # 打印监控日志
        print(f"📊 监控指标 {metrics['time']}:")
        for k, v in metrics.items():
            if k != "time" and k != "skill":
                print(f"   {k}: {v}")
        # 写入日志文件
        with open("./logs/skill_metrics.log", "a", encoding="utf-8") as f:
            f.write(str(metrics) + "\n")
        return metrics

image.gif

2.8 回滚:core/rollback.py

回滚管理器:异常时快速恢复历史版本

from core.dynamic_loader import DynamicLoader
from core.skill_registry import SkillRegistry
import json
from config.redis_config import redis_client
class RollbackManager:
    """技能版本一键回滚"""
    @staticmethod
    def rollback_skill(skill_name: str, old_version: str = "1.0.0"):
        """回滚到指定稳定版本"""
        print(f"⏪ 开始回滚技能【{skill_name}】到版本 {old_version}")
        # 构建旧版本路径
        old_path = f"./skills/{skill_name}_v{old_version}.py"
        # 热加载旧版本
        success = DynamicLoader.load_skill(skill_name, old_path)
        if success:
            # 更新注册信息:版本号和路径都恢复为旧版本
            skill_info = SkillRegistry.get_skill_info(skill_name)
            if skill_info:
                skill_info["version"] = old_version.replace("_", ".")
                skill_info["path"] = old_path
                skill_info["status"] = "online"
                redis_client.set(f"skill:{skill_name}", json.dumps(skill_info))
            
            print(f"✅ 回滚完成:【{skill_name}】已恢复至稳定版本 {old_version}")

image.gif

2.9 稳定版技能:skills/bill_query_v1_0_0.py

# 账单查询技能 v1.0.0(稳定版)
def execute(user_id):
    return f"【v1.0.0】用户 {user_id} 当前账户余额:10000 元"

image.gif

2.10 灰度新版技能:skills/bill_query_v1_0_1.py

# 账单查询技能 v1.0.1(新版本)
def execute(user_id):
    return f"【v1.0.1】用户 {user_id} 余额:10000 元 | 本月账单已自动分期"

image.gif

2.11 运行日志:logs/skill_metrics.log

{'skill': 'bill_query', 'success_rate': '100%', 'response_time': '0.28s', 'error_rate': '0%', 'cpu_usage': '40.4%', 'time': '2026-04-07 20:33:13'}
{'skill': 'bill_query', 'success_rate': '100%', 'response_time': '0.28s', 'error_rate': '0%', 'cpu_usage': '7.6%', 'time': '2026-04-07 20:39:10'}
{'skill': 'bill_query', 'success_rate': '100%', 'response_time': '0.28s', 'error_rate': '0%', 'cpu_usage': '3.4%', 'time': '2026-04-07 20:42:18'}
......

image.gif

3. 运行结果

============================================================

🔥 企业级智能体 Skill 热更新与灰度发布系统启动

============================================================

📌 步骤0:初始版本调用测试(更新前)

✅ 技能【bill_query】热加载成功:./skills/bill_query_v1_0_0.py

[初始版本 v1.0.0] 调用结果: 【v1.0.0】用户 user_test 当前账户余额:10000 元

📌 步骤1:注册新版本 Skill(灰度发布中)

📌 步骤2:动态热加载 Skill(不停服)

✅ 技能【bill_query】热加载成功:./skills/bill_query_v1_0_1.py

📌 步骤3:灰度路由分发测试

[灰度用户] user001 → 路由到【新版本 1.0.1】

[普通用户] user003 → 路由到【稳定旧版本 v1.0.0】

📌 步骤4:实时监控 Skill 运行指标

📊 监控指标 2026-04-07 20:48:11:

  success_rate: 100%

  response_time: 0.28s

  error_rate: 0%

  cpu_usage: 5.0%

==================================================

✅ 灰度验证无异常,执行全量发布

==================================================

🔄 技能【bill_query】状态已更新:online

📌 当前版本调用测试: 【v1.0.1】用户 test_user 余额:10000 元 | 本月账单已自动分期

==================================================

⚠️  模拟新版本异常,触发自动回滚

==================================================

⏪ 开始回滚技能【bill_query】到版本 1_0_0

✅ 技能【bill_query】热加载成功:./skills/bill_query_v1_0_0.py

✅ 回滚完成:【bill_query】已恢复至稳定版本 1_0_0

📌 步骤7:回滚后验证 - 调用不同版本Skill

✅ 技能【bill_query】热加载成功:./skills/bill_query_v1_0_0.py

[回滚后-旧版本 v1.0.0] 调用结果: 【v1.0.0】用户 user_test 当前账户余额:10000 元

[新版本 v1.0.1] 调用结果: 【v1.0.1】用户 user_test 余额:10000 元 | 本月账单已自动分期

📌 回滚后路由验证:

[任意用户] user001 → 路由到【全量版本 1.0.0】

============================================================

🎯 全流程执行完成:热更新 → 灰度 → 全量 → 回滚 → 验证

============================================================

五、总结

       SKILL架构的热更新与灰度发布,简单说就是给企业级智能体装上了不停服、更安全、可反悔的工程化能力。传统智能体改个功能、修个bug都要重启服务,一停机就影响业务,在金融、政务、工业这种对可用性要求极高的场景里根本扛不住。而这套方案通过SkillRegistry实现技能动态加载,新增、修改、删除单个技能都不用重启核心服务,真正做到无感升级。

       再配合灰度发布,先把新技能放给小部分用户试用,一边跑一边监控成功率、响应速度、错误率这些关键指标,没问题再逐步全量上线,避免一个小bug波及全部用户。万一新版本出状况,还能快速回滚到历史稳定版本,而且只影响出问题的技能,其他功能照常运行,把风险降到最低。

       整体看下来,这套机制不仅解耦了大模型核心和业务技能,还让智能体具备了企业级高可用水准,能轻松适配各类严苛场景。不管是迭代效率、运行稳定性还是风险控制,都彻底解决了传统架构更新必停机的痛点,让大模型智能体真正能稳定落地生产环境。

相关文章
|
4天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
8366 37
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
3天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
4天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
567 3
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
4天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
590 4
|
4天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
704 150
|
4天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
1932 10
|
4天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
4天前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
725 1
|
4天前
|
人工智能 安全 定位技术
CodeGraph深度解析 让Claude Code工具调用直降七成的核心原理与实操教程
如今以Claude Code为代表的AI编程智能体已经成为开发者日常编码、项目重构、漏洞修复的必备工具。但在长期使用过程中,几乎所有开发者都会遇到同一个明显痛点:AI虽然具备强大的代码生成与分析能力,却常常陷入盲目探索的循环中。
1336 2
|
4天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
507 2

热门文章

最新文章