文字识别

首页 标签 文字识别
# 文字识别 #
关注
5880内容
|
10天前
| |
来自: 云存储
7天,370部,4.2TB:一次出海短剧翻译的极限交付
7天交付370部短剧、4.2TB数据、0返工——这是我们刚完成的一个出海译制项目。从云端直连入库、批量转码压缩、AI字幕擦除到标准化交付,全流程复盘。做短剧出海的,这篇实战经验值得一看。
|
13天前
|
macOS 上值得推荐的软件(第一弹)
本文推荐三款提升macOS使用效率的优质软件:Longshot(支持滚动截图的截图工具)、Mos(优化鼠标平滑滚动与方向设置)、NetNewsWire(免费开源RSS阅读器)。涵盖截图、系统操作与信息获取场景,助力程序员高效工作。无广告,可免费试用,欢迎体验与分享。
|
13天前
|
AI时代的创作革命:技术进步还是灵感侵蚀?
本文探讨AI创作的双面性:一方面提升效率,释放创作潜力;另一方面可能侵蚀原创灵感,引发归属与价值困惑。作者以故事类比,呼吁在技术浪潮中保持人性创作的核心,寻求人机平衡的共生之道。
|
13天前
|
Windows 上值得推荐的软件(第一弹)
本文推荐两款提升Windows使用效率的神器:Listary,实现文件快速搜索与路径跳转;uTools,集快捷启动、剪贴板智能识别与丰富插件于一体,助力高效办公。
|
18天前
| |
OCR与语义分割技术详解:法小师如何智能解析纸质合同
语义分割结合OCR,实现文档像素级理解,精准识别标题、表格、签名等元素,破解传统OCR无法解析版面的难题。通过深度学习与多模态融合,将复杂合同转化为可编辑、可分析的结构化数据,助力智能文档处理迈向“机器认知”新阶段。(238字)
RAG分块应用中普遍存在的问题
RAG系统面临准确性、召回率与复杂文档解析三大挑战:模型易产生幻觉、检索噪声干扰、细粒度理解不足;语义匹配局限导致漏检,长尾知识覆盖差,多跳推理困难;表格、公式、图片等非结构化数据处理难,上下文割裂、逻辑结构丢失。合理分块策略是破局关键。
|
21天前
| |
来自: 视觉智能
智慧政务大厅的数字化转型:关键技术架构与终端解决方案评测
智慧政务大厅正迈向智能化,通过边缘计算、AI与物联网技术融合,构建“感知—认知—行动”闭环。依托大模型、OCR、生物识别等技术,实现语义理解、智能导办与设备协同,推动服务从“能办”到“好办、主动办”升级。
|
22天前
|
从读图到懂图,AI+金融理解力新升级
OCR要落伍了?多模态大模型凭借端到端的图像识别与语义理解能力,正在颠覆传统 OCR 的应用逻辑,预示着图像识别与理解正迈向新一代的技术范式。
实用代码工具:Python打造PDF选区OCR / 截图批量处理工具(支持手动/全自动模式)
一款基于Python的PDF区域OCR与截图工具,支持精准框选、文字识别、图片截取及Excel一键导出。内置手动审核与全自动批量处理模式,结合PyMuPDF、easyocr等技术,实现高效、可视化的PDF数据提取,适用于发票、报表等场景,显著提升办公效率。
免费试用