测试技术

首页 标签 测试技术
# 测试技术 #
关注
74833内容
大模型微调实战——从数据准备到落地部署全流程
本文以7B大模型为例,手把手教你零代码完成办公场景微调:从数据清洗、LoRA轻量训练到效果验证与一键部署,全程无需GPU和编程基础,30分钟快速上手,解决“通用模型不精准、输出不可控”痛点,让大模型真正落地业务。
|
1月前
|
2026年OpenClaw(原Clawdbot)插件化重构技术解析及一键部署教程
2026年OpenClaw(原Clawdbot)通过PR #661完成重大插件化重构,核心是将模型提供商(Provider)从核心代码中解耦,转化为可独立分发的插件包。此次重构并非简单的代码整理,而是架构范式的根本性转变,告别了单体架构的紧耦合、路由膨胀与测试污染等问题,基于标准接口+动态加载的新架构,实现依赖隔离、并行开发与版本自治。尽管启动开销略有增加,但生态扩展性与安全性显著提升,标志着OpenClaw从“单一项目”向“开放平台”迈出关键一步。
为什么 loss 看起来很好,模型却更危险了
本文揭示大模型微调中一个关键陷阱:loss持续下降≠模型更安全。相反,当loss“好看”时,模型可能因过度拟合训练数据中的偏差、模板或错误表达而变得更危险——回答更笃定、拒答率下降、边界问题越界更隐蔽。根本原因在于:loss衡量的是“复现训练文本”的能力,而非“行为是否可靠/合规”。工程上应转向以事实正确率、拒答率、自信度、越界率等为核心的行为评估体系,将loss仅作为训练健康度的辅助信号。
|
1月前
|
OpenClaw(原 Moltbot、Clawdbot)快速部署及 Web 页面集成详细教程
OpenClaw(原Moltbot、Clawdbot)作为一款功能实用的工具,在部署与使用过程中,用户可能会遇到各类操作疑问或故障问题。本文将结合官方指导信息,详细梳理OpenClaw的部署流程,并针对高频出现的常见问题提供全面的解答,助力用户顺利完成部署与使用,全程无营销相关内容,严格遵循原有信息的真实性与完整性。
|
2月前
|
AI Agent 职业路线:人机协作时代的技术人进阶体系与实践方法
本文提出AI Agent时代技术人的职业进阶框架:从“工具使用者”转向“智能体协作者/管理者”,构建范式转移、职业分层(执行层/协作者/集群管理者)、核心能力(需求拆解、批判校验、持续调优)与进阶路径(单点落地→多Agent编排→集群治理)四大维度,强调人机共生下的不可替代性。(239字)
|
2月前
|
从24G到8G:大模型调存优化全攻略(新手保姆级)
本文揭秘大模型显存消耗的四大“吃金兽”(参数、梯度、优化器状态、激活值),并提供零代码优化方案:LoRA/QLoRA微调、BF16混合精度、梯度累积与梯度检查点。实操指南助你用RTX 3060/4060等入门卡高效微调7B模型,显存直降70%+,兼顾效果与速度。(239字)
|
2月前
|
2026年阿里云 OpenClaw(原 Moltbot/Clawdbot)云服务一键部署保姆级教程
OpenClaw(前身为Moltbot、Clawdbot)是一款具备自然语言理解、任务自动化与多工具集成能力的AI代理工具,阿里云为其提供专属云服务部署方案,通过预配置环境、简化流程设计,实现“一键部署”落地。本教程严格遵循阿里云官方操作逻辑,从前期准备到功能验证,拆解每一步操作细节与注意事项,全程无营销词汇,确保零基础用户也能按步骤完成部署。
|
2月前
|
2026年阿里云无影AgentBay构建企业版Moltbot(原Clawdbot)部署教程
阿里云无影AgentBay是面向企业级场景的Agent开发与管理平台,集成开发套件、算力调度、权限管控等核心能力,可快速构建适配企业需求的定制化AI代理。2026年,依托无影AgentBay部署企业版Moltbot(原Clawdbot),能实现任务自动化、跨系统协同、数据安全管控等企业级功能,适配办公自动化、研发辅助、客户服务等多场景。本文严格依据官方部署逻辑,拆解从环境准备到功能上线的全流程,全程无营销词汇,确保信息原汁原味、可直接落地。
|
2月前
|
TestStudio_Ultimate自动化测试完整安装与使用指南
Telerik Test Studio Ultimate 2016 是一款支持Web、桌面及移动应用的自动化测试工具。本安装包(v2016.3.0928.5)适用于Win7/8/10(64位),需.NET 4.5+、4GB内存及10GB磁盘空间。安装流程简洁,支持完整或自定义安装,建议临时关闭杀软以避免误拦。(239字)
|
2月前
|
智能体来了:2026 AI元年的核心演进
内容摘要:2026年人工智能从“对话框时代”全面跨入“智能体(Agent)时代”。本文深度解析智能体如何重构生产力逻辑,拆解决策、决策、行动的核心架构,并为企业与个人提供切实可行的部署方案以避坑为基础。
免费试用