文字识别

首页 标签 文字识别
# 文字识别 #
关注
5834内容
AR眼镜在巡检业务中的软件架构设计|阿法龙XR云平台
引入AR眼镜与AI融合的巡检方案,构建“端-边-云”协同架构,实现工单可视化、AR叠加数据、智能识别表计与异常、远程协作及自动报告生成,提升工业巡检效率与智能化水平。
|
2月前
|
这是我写的实施一地两检的跨境高铁站旅客资料预报系统的系统架构
本系统参考民航APIS设计,实现青青草原国高铁跨境旅客资料预报与行程监控。通过铁路与移民管理部门数据联动,完成旅客购票、检票、乘车及退票等全流程边检预报与身份验证,保障一地两检高效合规运行。
实战对比:百炼知识库与钉钉知识库的全方位对比
百炼知识库依托通义千问大模型,具备强大的多模态处理能力,支持实时知识更新与深度文档解析,适用于复杂业务场景;钉钉知识库则深度集成钉钉办公生态,侧重流程化办公场景,适合日常办公需求。两者在智能引擎、格式兼容、文档解析、交互体验、知识精准度、成本结构及管理流程等方面各有优势,企业可根据自身需求选择合适的知识管理工具。
基于C#实现照片条形码识别
基于C#实现照片条形码识别
RAG效果不佳?先别急着微调模型,这几个关键节点才是优化重点
本文深入探讨了RAG(Retrieval Augmented Generation)技术的实现细节与优化策略,指出在AI应用开发中,RAG常被视为黑盒导致问题定位困难。文章从文档分块(Chunking)、索引增强(语义增强与反向HyDE)、编码(Embedding)、混合检索(Hybrid Search)到重排序(Re-Ranking)等关键环节进行了详细解析,强调需结合具体场景对各模块进行调优,以提升召回率与精确率的平衡,并倡导从快速使用走向深度优化的实践路径。
面壁开源多模态新旗舰MiniCPM-V 4.5,8B 性能超越 72B,高刷视频理解又准又快
今天,面壁智能正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长!高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。
|
3月前
|
为大家介绍5个好用的小软件
本文介绍了五款实用软件:Aconvert(文件转换)、XYplorer(文件管理)、3171.CN(在线AI工具箱)、Wondershare PDF(PDF处理)和净网大师(网络优化),涵盖办公、文件处理与上网优化,助力提升日常效率。
基于YOLOv8的文档图像表格检测与识别系统设计与实现(源码打包)
相比传统图像处理方法,YOLOv8 在表格检测任务中展现出更强的鲁棒性与泛化能力,尤其在复杂背景、扫描文档、低分辨率场景下依然保持高精度表现。同时,项目提供完整的训练流程与标注数据集,便于用户根据具体业务场景进行迁移学习与模型微调。
免费试用