从人工到AI驱动:天猫测试全流程自动化变革实践

简介: 天猫技术质量团队探索AI在测试全流程的落地应用,覆盖需求解析、用例生成、数据构造、执行验证等核心环节。通过AI+自然语言驱动,实现测试自动化、可溯化与可管理化,在用例生成、数据构造和执行校验中显著提效,推动测试体系从人工迈向AI全流程自动化,提升效率40%以上,用例覆盖超70%,并构建行业级知识资产沉淀平台。

在AI时代天猫技术质量同学在质量保障方面也不断探索AI在测试全流程提效的落地方案,传统测试工作链条拆解为“需求解析 → 用例生成 → 数据构造 → 执行验证 → 对比校验”五大核心阶段,而我们的目标是通过AI+自然语言驱动,实现全流程自动化、可溯化、可管理化。而最AI参与到测试中来,最主要的目标就是提效,目前几个月的实践下来发现在用例生成、测试数据构造和交易链路数据执行的过程中提效明显,下面来给大家简单介绍一下AI参与在测试流程中的实践方案。


一、测试体系变革:从人工到AI自动化


1. 传统手工测试的痛点

在传统模式下,测试链路主要靠人工推动,流程分散、效率低下、数据覆盖不全且复用性差。人工设计用例容易受主观影响,测试数据构造耗时且易遗漏,结果校验繁琐且易出错,测试报告依赖人工整理,迭代响应迟缓。


2. 从纯手工测试到AI辅助的转变

1. 手工测试 → AI辅助半自动化:以数据与校验为突破口在手工测试阶段,所有环节(用例设计、数据构造、执行与校验、报告生成)完全依赖人工,测试效率受限于人力投入,且数据构造易出现覆盖不全、校验结果易受主观判断干扰。 向AI辅助半自动化阶段的转变,首次突破点在于测试数据构造与结果校验的提效:

  • 数据构造:通过引入AI生成工具(如交易测试数据批量构造),在人工定义核心规则后,AI可快速辅助进行数据对比,大幅减少人工构造重复性数据的时间成本。 校验环节:利用自动化脚本配置(结算数据批量校验等工具),例如通过预设的汇金收款账号、出款账号信息进行批量对比,显著降低人工校验的漏检率与耗时。 同时,测试报告生成实现完全自动化,但用例设计仍依赖人工经验,这一阶段标志着测试流程从“全人工”向“人与AI协作”的初步过渡。


2. AI辅助半自动化 → AI全流程自动化:在交易链路测试的探索及实践的过程中,AI辅助的半自动化阶段,虽然数据构造与校验效率已提升,但测试用例的设计由人工设计。

这个阶段探索通过使用AI的介入实现全环节自动化:

  • 用例设计:AI通过分析用户对需求文档的核心内容解析,自动生成覆盖核心功能用例,由人机交互补充异常case,极大提升测试用例的设计效率。
  • 数据构造升级:基于自动生成的测试用例模板,进行大模型训练自动生成匹配的测试数据。减少人工构造测试数据的时间成本。
  • 经过多次的训练、模型的选择、自然语言的调试,实现了简单需求的全流程自动化测试:从需求输入到测试执行,虽然人在这个过程中仍然处于主导作用,但是人工介入的成本非常低,而AI则承担核心的执行能力,人工仅需介入异常复核或策略优化,实现测试效率的指数级提升与质量的持续优化。


3. 智能流程融合与持续优化:在AI辅助流程半自动化过程中我们发现AI虽然深入参与了需求测试的全流程,但是用例资产无法沉淀、测试数据无法构造等问题限制了后续能力的拓展,所以在第三阶段我们通过多个工程系统对接(用例管理平台、测试数据构造平台、知识库沉淀)实现了真正的数据变为资产、AI全流程驱动的工程化模式

  • AI生成用例同步至用例管理平台,实现团队多角色协作、历史用例沉淀。
  • AI结合数据工厂和工具编排,自动感知业务变更,快速调整测试范围与策略,知识资产不断沉淀。


4.实践效果展示:

  • 用例生成及编辑:根据用户输入的测试分析进行测试用例组装,并支持人机交互式修改;


  • 测试数据构建:通过调用底层测试数据数据平台通过关键词匹配获取测试数据,批量构建测试数据;

  • 测试数据执行:通过从提示词中获取用户指令将测试数据推进到指定状态,支持批量执行;


二、AI全链路自动化测试所需关键能力

通过不断的摸索与探索,我们总结出了一套可复用、可实现的思路及方案。

1. 流程编排与统一入口

  • 平台实现用例设计、数据生成、测试执行、校验、报告归档“一站式”自动编排。
  • 工作流引擎支持分支条件、异常管理,提升复杂链路测试的灵活性与准确率。
  • 打通内部用例管理与外部数据源,支持历史场景回溯与快速应对新业务。

2. AI智能理解与场景建模

  • 支持自然语言输入业务需求,AI自动拆解为结构化测试场景和执行步骤。
  • 基于GPT等大模型持续训练,提升语义理解和场景覆盖能力。
  • 高级异常场景推理,覆盖边界case与特殊类型,防止因场景遗漏产生业务风险。

3. 自动化工具集成与API调用

  • 支持用例管理平台、数据构造平台、数据结果校验能力 等核心平台及API能力串联,完成数据自动化执行及校验的闭环。

4. 测试数据工厂及智能分配

  • 根据测试用例及关键信息由AI自动匹配高质量测试商品、买家、卖家、门店等数据。
  • 自动校验数据有效性与覆盖率,平台自动预警数据孤岛和缺失场景。
  • 动态维护实时商品池,支持数据历史追溯与用例复用。

5. 智能校验、报告与归档能力

  • 自动解析交易链路回流数据,关键字段自动比对(如资金分账、退款、账单等)。
  • 校验方案高度可配置,支持跨平台、跨链路数据的多维对比。
  • 报告自动化输出,支持Markdown表格、XMind脑图、用例平台同步,实现一键推送业务与管理团队。

6. 用例协作与行业知识资产沉淀

  • 提供用例规划管理、版本归档、需求变更自动跟进、多团队复盘协作。
  • 实现测试经验沉淀与共享,推动知识资本化与持续创新,提高团队测试能力基线。
  • 支持AI驱动的用例复用与补全,让平台成为行业方案孵化的智库。


三、技术架构实践与数据流示意

基于以上基础思路将知识库、数据构造平台、测试用例管理平台通过AI进行连接,实现需求的全链路自动化测试。

平台能力及功能介绍


四、落地收获与未来趋势

效果与现状:

  • 已在多业务线实现自动化测试全链路落地,需求-用例-数据-执行-校验贯穿周期缩短40%。
  • AI自动生成用例覆盖度超过70%,极大释放产力。

创新展望:

  • 拓展AI在需求测试中的覆盖范围,构建行业级测试知识库,平台用例、自动化工具、AI模型双向沉淀,推动三方协作与方案共建。
  • 驱动研发/测试一体化自动化运转。



来源  |  阿里云开发者公众号

作者  |  千流

相关文章
|
2天前
|
存储 弹性计算 人工智能
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
2025年9月24日,阿里云弹性计算团队多位产品、技术专家及服务器团队技术专家共同在【2025云栖大会】现场带来了《通用计算产品发布与行业实践》的专场论坛,本论坛聚焦弹性计算多款通用算力产品发布。同时,ECS云服务器安全能力、资源售卖模式、计算AI助手等用户体验关键环节也宣布升级,让用云更简单、更智能。海尔三翼鸟云服务负责人刘建锋先生作为特邀嘉宾,莅临现场分享了关于阿里云ECS g9i推动AIoT平台的场景落地实践。
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
|
4天前
|
云安全 数据采集 人工智能
古茗联名引爆全网,阿里云三层防护助力对抗黑产
阿里云三层校验+风险识别,为古茗每一杯奶茶保驾护航!
古茗联名引爆全网,阿里云三层防护助力对抗黑产
|
4天前
|
存储 机器学习/深度学习 人工智能
大模型微调技术:LoRA原理与实践
本文深入解析大语言模型微调中的关键技术——低秩自适应(LoRA)。通过分析全参数微调的计算瓶颈,详细阐述LoRA的数学原理、实现机制和优势特点。文章包含完整的PyTorch实现代码、性能对比实验以及实际应用场景,为开发者提供高效微调大模型的实践指南。
531 1
kde
|
4天前
|
人工智能 关系型数据库 PostgreSQL
n8n Docker 部署手册
n8n是一款开源工作流自动化平台,支持低代码与可编程模式,集成400+服务节点,原生支持AI与API连接,可自托管部署,助力团队构建安全高效的自动化流程。
kde
358 3
|
2天前
|
Linux 虚拟化 iOS开发
VMware Workstation Pro 25H2 for Windows & Linux - 领先的免费桌面虚拟化软件
VMware Workstation Pro 25H2 for Windows & Linux - 领先的免费桌面虚拟化软件
733 4
VMware Workstation Pro 25H2 for Windows & Linux - 领先的免费桌面虚拟化软件
|
3天前
|
JavaScript 开发工具 Android开发
如何在原生 App 中调用 Uniapp 的页面?
如何在原生 App 中调用 Uniapp 的页面?
243 138
|
4天前
|
存储 人工智能 Java
AI 超级智能体全栈项目阶段四:学术分析 AI 项目 RAG 落地指南:基于 Spring AI 的本地与阿里云知识库实践
本文介绍RAG(检索增强生成)技术,结合Spring AI与本地及云知识库实现学术分析AI应用,利用阿里云Qwen-Plus模型提升回答准确性与可信度。
254 91
AI 超级智能体全栈项目阶段四:学术分析 AI 项目 RAG 落地指南:基于 Spring AI 的本地与阿里云知识库实践