文字识别

首页 标签 文字识别
# 文字识别 #
关注
5833内容
实战对比:百炼知识库与钉钉知识库的全方位对比
百炼知识库依托通义千问大模型,具备强大的多模态处理能力,支持实时知识更新与深度文档解析,适用于复杂业务场景;钉钉知识库则深度集成钉钉办公生态,侧重流程化办公场景,适合日常办公需求。两者在智能引擎、格式兼容、文档解析、交互体验、知识精准度、成本结构及管理流程等方面各有优势,企业可根据自身需求选择合适的知识管理工具。
基于C#实现照片条形码识别
基于C#实现照片条形码识别
RAG效果不佳?先别急着微调模型,这几个关键节点才是优化重点
本文深入探讨了RAG(Retrieval Augmented Generation)技术的实现细节与优化策略,指出在AI应用开发中,RAG常被视为黑盒导致问题定位困难。文章从文档分块(Chunking)、索引增强(语义增强与反向HyDE)、编码(Embedding)、混合检索(Hybrid Search)到重排序(Re-Ranking)等关键环节进行了详细解析,强调需结合具体场景对各模块进行调优,以提升召回率与精确率的平衡,并倡导从快速使用走向深度优化的实践路径。
面壁开源多模态新旗舰MiniCPM-V 4.5,8B 性能超越 72B,高刷视频理解又准又快
今天,面壁智能正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长!高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。
|
2月前
|
为大家介绍5个好用的小软件
本文介绍了五款实用软件:Aconvert(文件转换)、XYplorer(文件管理)、3171.CN(在线AI工具箱)、Wondershare PDF(PDF处理)和净网大师(网络优化),涵盖办公、文件处理与上网优化,助力提升日常效率。
基于YOLOv8的文档图像表格检测与识别系统设计与实现(源码打包)
相比传统图像处理方法,YOLOv8 在表格检测任务中展现出更强的鲁棒性与泛化能力,尤其在复杂背景、扫描文档、低分辨率场景下依然保持高精度表现。同时,项目提供完整的训练流程与标注数据集,便于用户根据具体业务场景进行迁移学习与模型微调。
RPA数字员工简介
RPA(机器人流程自动化)是一种通过软件机器人模拟人工操作,实现业务流程自动化的技术。它能跨系统执行任务,如数据搬运、对账、审批等,大幅提升效率。随着AI融合,RPA具备了“读写看懂”的能力,广泛应用于金融、制造、政务、医疗等领域,正从桌面工具演变为企业级“数字员工”,推动运营模式变革。
|
2月前
| |
Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务22
Dots.ocr 是一款仅1.7B参数的视觉语言模型,正在重塑文档处理技术。它将布局检测、文本识别、阅读顺序理解和数学公式解析等任务统一于单一架构,突破传统OCR多模块流水线的限制。在多项基准测试中,其表现超越大参数模型,展现出“小而精”的实用价值,标志着OCR技术向高效、统一、灵活方向演进。
免费试用