文字识别

首页 标签 文字识别
# 文字识别 #
关注
5809内容
Dify知识库调优秘籍:6步精准改造,让AI回答从此可靠无误
本文分享了提升Dify知识库准确率的六个关键步骤,帮助用户在十分钟内将AI从“答非所问”变为“行业专家”。内容涵盖文档选择、分段优化、提示词配置、手动校验、测试反馈与模型升级,助你打造高精准度的AI问答系统。
面壁开源多模态新旗舰MiniCPM-V 4.5,8B 性能超越 72B,高刷视频理解又准又快
今天,面壁智能正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长!高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。
|
10天前
|
为大家介绍5个好用的小软件
本文介绍了五款实用软件:Aconvert(文件转换)、XYplorer(文件管理)、3171.CN(在线AI工具箱)、Wondershare PDF(PDF处理)和净网大师(网络优化),涵盖办公、文件处理与上网优化,助力提升日常效率。
|
14天前
|
基于YOLOv8的文档图像表格检测与识别系统设计与实现(源码打包)
相比传统图像处理方法,YOLOv8 在表格检测任务中展现出更强的鲁棒性与泛化能力,尤其在复杂背景、扫描文档、低分辨率场景下依然保持高精度表现。同时,项目提供完整的训练流程与标注数据集,便于用户根据具体业务场景进行迁移学习与模型微调。
RPA数字员工简介
RPA(机器人流程自动化)是一种通过软件机器人模拟人工操作,实现业务流程自动化的技术。它能跨系统执行任务,如数据搬运、对账、审批等,大幅提升效率。随着AI融合,RPA具备了“读写看懂”的能力,广泛应用于金融、制造、政务、医疗等领域,正从桌面工具演变为企业级“数字员工”,推动运营模式变革。
|
18天前
| |
Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务22
Dots.ocr 是一款仅1.7B参数的视觉语言模型,正在重塑文档处理技术。它将布局检测、文本识别、阅读顺序理解和数学公式解析等任务统一于单一架构,突破传统OCR多模块流水线的限制。在多项基准测试中,其表现超越大参数模型,展现出“小而精”的实用价值,标志着OCR技术向高效、统一、灵活方向演进。
|
18天前
|
大模型能力评测方式很多?
AI评测非单一分数比拼,而是多维度、多方法的系统工程。其核心框架可拆解为基础维度、主流基准与关键方法,共同构成模型能力的“CT扫描”系统。
从零开始打造AI测试平台:文档解析与知识库构建详解
AI时代构建高效测试平台面临新挑战。本文聚焦AI问答系统知识库建设,重点解析文档解析关键环节,为测试工程师提供实用技术指导和测试方法论
免费试用