测试技术

首页 标签 测试技术
# 测试技术 #
关注
74761内容
|
4天前
| |
来自: 数据库
基于 VectorDBBench 的性能评测与架构解析:Lindorm 向量引擎的优化实践
阿里云Lindorm向量检索服务重磅升级,依托CBO/RBO混合优化器与自适应混合索引,实测QPS达5.6万(百万级)、2.4万+(千万级),P99延迟低至2ms,融合检索性能行业领先,全面支撑AI时代高并发、低延迟、强一致的生产级向量应用。
RAG效果好不好,全看这一步做没做对
文档切分是RAG效果的关键瓶颈:粗暴的固定长度切分易割裂语义、导致检索不全或错乱;而语义切分(依段落/标题/Embedding相似度)可保障信息完整性。结合重叠切分、元数据增强与结构化解析,能显著提升召回率与答案质量。
你的大模型微调对了吗?科学评估让训练效果肉眼可见
本文探讨大模型微调中科学评估的关键性,指出仅看训练loss易误判效果。提出多维评估体系:兼顾通用能力(如MMLU、C-Eval)、任务特定指标与灾难性遗忘监测;倡导分层评估(快速筛选→完整验证→人工评审);强调数据隔离防泄露、多源评估保代表性;最终以评估驱动闭环优化,实现高效迭代。
AI应用软件的开发
2026年AI应用开发已迈入“AI原生”时代:以Spec-to-Application为核心,依托推理路由、Graph-RAG记忆、MCP协议、执行沙箱与自动Eval-Loop,实现从确定性编码到概率性智能体编排的范式跃迁。低代码普及,可信可解释成为标配。(239字)
|
5天前
|
【轴承故障检测】【借助倒谱预白化技术在变速条件下诊断轴承故障的应用】带通滤波后的倒谱预白化的平方包络谱用于轴承故障检测(Matlab代码实现)
【轴承故障检测】【借助倒谱预白化技术在变速条件下诊断轴承故障的应用】带通滤波后的倒谱预白化的平方包络谱用于轴承故障检测(Matlab代码实现)
大模型微调后,如何判断它是不是“变聪明”了?这套评估方法论请收好。
本文系统阐述大模型微调效果评估的核心价值与实践方法:强调评估是检验泛化能力的“试金石”,须坚持人工主观评估(重业务适配性)与自动化客观评估(重量化指标)双轨并行;详解测试集构建、指标选择、基线对比等关键步骤,助力从0到1建立科学、可信、可迭代的评估体系。(239字)
|
5天前
|
性能提升10倍!我用Rust重写Python轨迹距离计算库的实践分享
本文介绍用Rust重写的轨迹距离计算库`traj-dist-rs`:解决原Python包`traj-dist`安装困难、依赖陈旧问题;支持7种主流算法(DTW、LCSS、Fréchet等)及欧氏/球面距离;通过零拷贝+泛型抽象+内存优化,性能达Cython版10倍、纯Python版389倍;提供Python友好API与高精度结果保障。
|
5天前
|
如何优雅地使用Python装饰器提升代码可读性
如何优雅地使用Python装饰器提升代码可读性
|
5天前
|
优雅的Python装饰器:让代码更简洁高效
优雅的Python装饰器:让代码更简洁高效
拒绝"体感"调优——如何科学地量化LLM微调效果
本文系统阐述大模型微调的科学评估方法:从训练损失曲线分析、C-Eval/CMMLU等基准测试,到LLM-as-a-Judge自动评分与人工Golden Test Set构建,最终整合为自动化评估流水线,助开发者告别“玄学调参”,实现效果可量化、过程可追踪、结果可复现。(239字)
免费试用