数据采集

首页 标签 数据采集
# 数据采集 #
关注
22034内容
田间杂草检测数据集分享(适用于YOLO系列深度学习分类检测任务)
本数据集含4000张真实农田图像(小麦/玉米/水稻田),YOLO格式标注杂草目标,覆盖多天气、光照与视角,适用于YOLO系列等目标检测模型训练,助力智能除草与精准农业研究。(239字)
|
2小时前
|
视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法
本文探讨视频RAG中的核心挑战——如何为无时间结构的视频转录文本设计有效分块策略。对比传统文本分块,提出基于停顿、重叠窗口、递归切分及LLM驱动的主题分块四层方案,实现细粒度检索与全局理解兼顾,提升视频内容检索准确性与上下文完整性。
|
12小时前
| |
医疗AI智能体:整体效能评估可视化:从原理到实践的10大核心量化指标体系.130
本文系统阐述医疗AI智能体的量化评估体系,强调其行业特殊性——关乎生命健康、强合规要求、用户多元、闭环严苛。提出覆盖技术(幻觉率、准确率、响应时间、召回率)与业务(满意度、审核通过率、问诊完成率、交互时长)的8大核心指标,配套数据采集、计算、监控、迭代闭环流程及可落地代码实现,为临床合规落地提供客观依据。
人工智能|YOLOv5必须了解的知识
本文详解YOLOv5网络结构(Input/Backbone/Neck/Head)及train.py核心实现:包括模型加载(预训练权重适配)、yaml配置解析、数据集读取与增强、标签格式说明、多尺度特征融合机制,以及推理阶段预处理、NMS过滤与结果可视化全流程。
人工智能|YOLOv1的损失函数和非极大值抑制
YOLOv1将图像划分为7×7网格,每格预测2个边界框(共98个),含中心点、宽高、置信度及20类概率。损失函数由坐标(加权5)、置信度(含/不含物体分权重)和分类三部分构成,均采用带平衡系数的均方误差,并以IoU为核心匹配与评估依据。(239字)
人工智能|YOLOv1的简单介绍
YOLOv1将输入图像划分为7×7网格,每个网格单元预测2个边界框(BBOX)及对应置信度,并输出20类概率。通过中心点归属、相对坐标偏移与归一化,实现端到端实时目标检测。(239字)
|
1天前
|
《OpenClaw行为审计与追溯系统设计》
本文针对OpenClaw智能体黑箱决策带来的可控性挑战,深入探讨了行为审计与追溯系统的构建思路与核心技术。文章指出行为审计的本质是智能体全生命周期的数字孪生,而非简单日志记录,详细阐述了原子化行为语义建模、分层数据采集、因果推理、行为指纹识别与意图溯源等关键技术,同时分析了异步处理架构、混合存储方案与隐私保护机制的实现要点。
打通货源数据:1688 商品详情 API 赋能小龙虾 AI 店铺复盘
后端工程师复盘小龙虾AI智能体项目:基于1688官方商品详情API(1688.item.get),攻克签名鉴权、限流风控、价格/规格不统一、权限脱敏等难题,实现批发价、库存、资质等B2B核心数据的稳定采集、清洗与结构化建模,赋能AI智能选品、定价与自动铺货。
基于MATLAB实现高斯混合模型(GMM)与马尔可夫模型结合
基于MATLAB实现高斯混合模型(GMM)与马尔可夫模型结合的技术方案,涵盖理论框架、核心代码和典型应用场景
|
1天前
|
GitHub热榜项目高效解读 Dify搭配EdgeOne搭建AI开源项目分析助手全教程
在开源技术蓬勃发展的当下,GitHub汇聚了全球海量优质开源项目,每日更新的热榜榜单更是开发者发掘新技术、学习优秀代码架构、寻找项目灵感的重要渠道。但对于绝大多数开发者而言,GitHub热榜存在一个普遍难题:榜单内项目数量繁多,项目介绍参差不齐,部分仓库仅有简单标题与简介,缺少完整功能说明、技术架构解析、使用场景梳理以及上手难度评估。
免费试用