TICA解读:AI智能体与大数据构造在智能测试领域的运用

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 导读:各位小伙伴,TICA2022已于2022年12月15日圆满落幕。想必大家还畅游在知识的海洋里无法自拔吧?应大家要求,小编将为大家深入解读一些Topic。本次给大家带来的Topic,是由又仁老师在大会中分享的“AI智能体与大数据构造在智能测试领域的运用”。

议题背景介绍


随着人工智能技术的普及,越来越多基于AI能力的产品、服务被推出市场,形成横向以场景驱动、纵向以AI原子能力驱动的综合布局。然而,与AI市场快速爆发的猛烈态势形成对比的是对于AI系统质量的保障手段及方法论依然处于边探索边前进的状态。本次又仁老师的分享聚焦于AI语音系统的质量保证体系方法论,从大规模数据采样、构造到智能体实现运用等视角切入,为基于AI语音能力的相关质量保障工作提供思路,分享可运用于工程实践的相关方法&手段。

智能系统的现状及挑战


在过去5-10年,随着技术端的不断发展,智能系统也得到快速的发展。智能系统由数据、硬件、工程以及算法组成,其中算法在智能系统里有着不可撼动的位置,从云端链路、终端测试、模型评测、工程封装等环节,不难看出智能系统有着链路长、不可解释性、场景复杂、数据要求高等特点。

image.png那么现有情况下,存在哪些挑战呢?以智能音箱为例,现在的语音识别产品在厂商的智能家居规划蓝图中是扮演一个人与机器交流的桥梁,那在实际应用中就要求音箱能够听得到人说的话,同时还要求它听得清晰和听得准。这就提出了第一个挑战——信噪比。所谓信噪比,就是目标信号与干扰信号强度比值的对数,我们需要一定的信噪比,才能让机器听得清楚。但根据声音的传播特性,它在空气中衰减会非常大,但人在与智能音箱交流的过程中,可能会处在不同的位置和距离。这就给智能发展提出了一个难题,同时也是语音识别所面临的最大挑战。第二个挑战是非稳态的噪声影响。如果我们面对的是规律的噪声,应对的办法无疑会简单很多。但在实际的使用环境中,我们经常会面对的是带有突发性和不可预见性的噪音,这也给智能领域的发展带来了不小的挑战。第三是多声源的问题。智能音箱在使用的过程中,只会听从一个声源的指令,但在人机交流的过程中,必然会出现干扰源。如何处理这个干扰的问题,也困扰着相关开发者和智能测试人员。基于这些业务开发挑战,智能系统的 测试挑战在数据准备、模型选型、模型训练、模型评测、工程部署等五大方面也反映出了几大难题:测试场景复杂、评测数据缺乏、依赖人力投入。其中模型评测时开发和测试会在研发流程上存在一定重合,所以都需要进行模型效果评测,这个时候团队内的信任将会大大提高覆盖率和智能化效率。


image.png

随着智能系统测试的不断发展,我们根据不同的分级标准也划分出了一个智能测试能力等级,根据这个等级即可判断出智能测试领域的发展情况及不足。

image.png

智能测试探索实践之路

基于前期智能测试的挑战,同时为了提高智能测试能力等级,又仁老师开始思考如何让智能系统更加智能呢?先从多场景开始头脑风暴,接着进行非结构化大数据的模拟构造。就是这样一个出发点形成了现在完整的智能测试架构:从智能数据采集加工、多元化场景构造、智能测试自动化到智能智测中心的系统架构我们不难看出智能测试的核心是什么:大数据+智能体+自动化。

image.png

测试大数据是智能测试中最开始的一环,数据的质量往往影响着智能测试的质量。将多元化的数据源整合在一起形成完整的数据流为我们的智能测试打下了很好的数据基础。

image.png

基于不同的能力将智能体大致分为三类:单一小模型、视觉语音中模型、多模态智能系统。不同类型意味着他们的通用性和专用性有很大的不同,在不同场景下选择合适的智能体将大大促进智能系统的智能化。

image.png

端到端评测、工程测试、模型评测组成了智能测试架构中的自动化场景,这三种模型在并发能力、人力方面各不相同,有利有弊,在智能化场景测试中选择合适的场景来进行测试能达到事半功倍的效果。自动化流程中需要特别注意:模型部署、工程调用、端侧发布等环节,每一步的失误都会导致智能测试不那么智能。

image.png

image.png



相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在软件测试中的转型力量###
本文深入探讨了人工智能(AI)技术在软件测试领域的应用现状与未来趋势,通过分析AI如何优化测试流程、提高测试效率与质量,揭示了AI赋能下软件测试行业的转型路径。传统测试方法面临效率低、成本高、覆盖率有限等挑战,而AI技术的引入正逐步改变这一格局,为软件测试带来革命性的变化。 ###
|
21天前
|
存储 数据采集 监控
大数据技术:开启智能决策与创新服务的新纪元
【10月更文挑战第5天】大数据技术:开启智能决策与创新服务的新纪元
|
4天前
|
机器学习/深度学习 人工智能 运维
智能运维:大数据与AI的融合之道###
【10月更文挑战第20天】 运维领域正经历一场静悄悄的变革,大数据与人工智能的深度融合正重塑着传统的运维模式。本文探讨了智能运维如何借助大数据分析和机器学习算法,实现从被动响应到主动预防的转变,提升系统稳定性和效率的同时,降低了运维成本。通过实例解析,揭示智能运维在现代IT架构中的核心价值,为读者提供一份关于未来运维趋势的深刻洞察。 ###
39 10
|
4天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
42 6
|
4天前
|
机器学习/深度学习 数据采集 人工智能
探索AI驱动的自动化测试新纪元###
本文旨在探讨人工智能如何革新软件测试领域,通过AI技术提升测试效率、精准度和覆盖范围。在智能算法的支持下,自动化测试不再局限于简单的脚本回放,而是能够模拟复杂场景、预测潜在缺陷,并实现自我学习与优化。我们正步入一个测试更加主动、灵活且高效的新时代,本文将深入剖析这一变革的核心驱动力及其对未来软件开发的影响。 ###
|
10天前
|
机器学习/深度学习 人工智能 安全
AI真的能与人类数据科学家竞争吗?OpenAI的新基准对其进行了测试
AI真的能与人类数据科学家竞争吗?OpenAI的新基准对其进行了测试
|
11天前
|
存储 人工智能 Java
将 Spring AI 与 LLM 结合使用以生成 Java 测试
AIDocumentLibraryChat 项目通过 GitHub URL 为指定的 Java 类生成测试代码,支持 granite-code 和 deepseek-coder-v2 模型。项目包括控制器、服务和配置,能处理源代码解析、依赖加载及测试代码生成,旨在评估 LLM 对开发测试的支持能力。
23 1
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在软件测试中的创新应用与实践###
本文旨在探讨人工智能(AI)技术如何革新软件测试领域,提升测试效率、质量与覆盖范围。通过深入分析AI驱动的自动化测试工具、智能化缺陷预测模型及持续集成/持续部署(CI/CD)流程优化等关键方面,本研究揭示了AI技术在解决传统软件测试痛点中的潜力与价值。文章首先概述了软件测试的重要性和当前面临的挑战,随后详细介绍了AI技术在测试用例生成、执行、结果分析及维护中的应用实例,并展望了未来AI与软件测试深度融合的趋势,强调了技术伦理与质量控制的重要性。本文为软件开发与测试团队提供了关于如何有效利用AI技术提升测试效能的实践指南。 ###
|
17天前
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
34 1
|
18天前
|
人工智能 算法 决策智能
面向软件工程的AI智能体最新进展,复旦、南洋理工、UIUC联合发布全面综述
【10月更文挑战第9天】近年来,基于大型语言模型(LLM)的智能体在软件工程领域展现出显著成效。复旦大学、南洋理工大学和伊利诺伊大学厄巴纳-香槟分校的研究人员联合发布综述,分析了106篇论文,探讨了这些智能体在需求工程、代码生成、静态代码检查、测试、调试及端到端软件开发中的应用。尽管表现出色,但这些智能体仍面临复杂性、性能瓶颈和人机协作等挑战。
45 1