基于深度学习和YOLOv11的错题自动切分系统

简介: 基于深度学习和YOLOv11的错题自动切分系统

基于DyHead和YOLOv11的错题自动切分系统

项目简介

集成动态头部检测与YOLOv11的智能错题识别系统,具备:

  • DyHead检测器:高精度题目区域分割
  • YOLOv11模型:5类错误符号识别(✕、/、✓̷、?、○)
  • 智能匹配引擎:支持中心点包含/重叠面积/IOU/距离四重匹配策略

核心技术

双模型协同架构

模块 技术方案 精度指标
题目分割 DyHead+Swim-Transformer mAP@0.5: 98.2%
错符检测 YOLOv11-640 F1-score: 96.5%

四级匹配策略

  1. 中心点包含(优先级最高)
  2. 重叠面积占比 >30%
  3. IOU相似度 >0.25
  4. 欧氏距离 <50px(兜底方案)

快速部署

环境配置

# 安装PyTorch+CUDA11.8  
pip install torch==2.4.1 torchvision==0.19.1 --index-url https://download.pytorch.org/whl/cu118  
# 安装项目依赖  
pip install -e detectron2 ultralytics flask pillow==9.5.0

模型部署

  1. 下载预训练模型:
  • DyHead权重:[cut_question.pth](提取码r5ht)
  • YOLOv11权重:[best.pt](提取码r5ht)
  1. 放置路径:
./configs/dyhead_swint_atss_fpn_2x_ms.yaml  
./yolo_ckps/best.pt

启动服务

python flask_error_detection.py  # 访问 http://localhost:5004

API接口文档

错题检测接口

Endpoint: POST /detect

请求示例

curl -X POST http://localhost:5004/detect -F "image=@test.jpg"

响应示例

{
  "success": true,
  "data": {
    "error_count": 3,
    "questions": [
      {
        "bbox": [100,50,200,150],
        "errors": [
          {
            "type": "cuo",
            "confidence": 0.92,
            "match_method": "中心点包含"
          }
        ]
      }
    ],
    "visualization": {
      "errors_img": "base64...",
      "matches_img": "base64..." 
    }
  }
}

系统架构

Cut/  
├── core/  
│   ├── dyhead_detector.py  # 题目区域分割  
│   └── yolo_detector.py    # 错符检测  
├── utils/  
│   ├── matcher.py          # 四级匹配算法  
│   └── visualization.py   # 结果可视化  
└── web/  
    ├── static/             # 前端资源  
    └── templates/          # HTML页面

效果演示

Web界面功能

  • 实时上传试卷图片
  • 错题区域高亮标注
  • 可下载切分后的错题图片集

![检测效果对比图]

左:原始试卷 | 右:错题标记与切分结果

📌 教育场景适配:支持A4/B5试卷、手写批改痕迹、多科目符号体

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
18天前
|
人工智能 运维 安全
阿里云百炼平台详解:官网入口链接、免费AI大模型领取及常见问题解答FAQ
在生成式人工智能技术全面落地的当下,各类大模型已经深度融入内容创作、视觉设计、视频制作、软件开发、企业智能服务等诸多领域。对于个人创作者、独立开发者以及中小微企业而言,如何低成本、安全、便捷地使用成熟大模型服务,成为开展AI相关工作的核心诉求。阿里云百炼作为阿里云推出的一站式大模型服务平台,整合了文本、图像、视频、多模态等全品类大模型,同时配套低代码智能体开发、应用部署、全链路安全管控等能力,能够满足从个人临时使用、原型开发到企业级规模化落地的各类需求。
952 3
|
18天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
951 12
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
18天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
865 16
|
18天前
|
Python
基于UNET的服装语义分割系统
基于UNET的服装语义分割系统
|
18天前
|
存储 人工智能 自然语言处理
阿里云骡子快跑 MuleRun详解:功能用途、收费标准及完整使用指南
阿里云MuleRun(骡子快跑)是一站式AI原生智能工作空间,支持自然语言驱动任务执行,具备四层记忆、主动智能与可信沙箱等能力,深度集成电商、CRM等数据源,助力企业自动化运营、多平台触达与分析提效。提供Team版(420元/席/月)和Enterprise版(2500元/席/年)。MuleRun(骡子快跑)官网:https://t.aliyun.com/U/gSCv7v
|
18天前
|
算法 PyTorch 算法框架/工具
基于PyTorch的EfficientDet进行水下目标检测 水下目标检测
项目概述:基于PyTorch的EfficientDet进行水下目标检测 在这个项目中,我们将通过实际比赛数据集演示如何训练最近开源的相对最先进的PyTorch版EfficientDet模型。本教程将涵盖从数据准备到模型训练、评估以及推断的全过程。值得注意的是,在本次实验中,我们没有采用任何数据增强技术或模型融合等后处理方法来提升模型精度;同样地,我们也未使用如UWGAN_UIE、水质迁移(WQT)、DG-YOLO或其他去雾算法对水下图像进行预处理。尽管这些技巧可能有助于提高识别准确率,但我们希望保持基础框架的纯粹性以专注于模型本身的性能。 1. 数据来源 我们的数据来自于科赛网举办的一次水下
|
18天前
|
机器学习/深度学习 文字识别 数据处理
基于OCR的水位检测项目 水位识别
基于OCR的水位检测项目 水位识别
|
18天前
|
人工智能 Rust 监控
这 3 个开源小工具,帮你让 Coding Agent 少吃点 Token
今天我们就来分享 3 个有用的开源项目,专门帮你的 Coding Agent 整理“上下文”:让它少翻无关代码,少吞冗长日志,把 token 留给更关键的信息。
216 0
这 3 个开源小工具,帮你让 Coding Agent 少吃点 Token