文字识别

首页 标签 文字识别
# 文字识别 #
关注
5827内容
|
14小时前
| |
来自: 视觉智能
【图片OCR识别用内容改名应用案例】用图片的内容改图片文件的名字,批量OCR识别图片上的文字并同时进行批量改名的操作,基于阿里云的实现详细步骤和注意事项
本系统通过OCR技术批量识别快递运单或商品图片中的关键文字信息,自动重命名为“单号-发货地-收货地”或“商品名-型号-规格”,支持多区域识别与表格导出,提升物流归档与电商管理效率。
|
1天前
|
《大模型驱动的智能文档解析系统:从领域适配到落地优化的全链路开发实践》
本文聚焦大模型在高端装备制造企业智能文档解析系统的落地实践,针对领域术语理解断层、长文档上下文限制、知识提取精准度不足、响应缓慢、微调成本高、稳定性差等核心痛点,提出对应解决方案:构建领域术语知识底座适配行业语境,以语义分块+关联图谱突破长文档解析瓶颈,用多轮校验+规则库保障知识可靠性,通过分层部署+多级缓存优化响应速度,采用增量微调+prompt工程降低成本并提升泛化能力,依托全链路监控+自动化运维保障长期稳定。优化后,术语识别准确率、知识逻辑完整性显著提升,单文档初步解析响应缩至3秒内,故障发生率降至1.2%,印证大模型落地需全链路协同且贴合领域需求。
|
1天前
|
《大模型赋能文化遗产数字化:古籍修复与知识挖掘的技术实践》
本文记录大模型赋能文化遗产数字化的实践,针对古籍异体字识别难、残缺文本补全不准、隐性知识难挖掘、多模态数据割裂、中小机构部署难、知识难更新等痛点,提出对应方案:搭建古籍文字与语境知识库提升识别理解率,以多源史料关联与历史逻辑约束实现文本精准补全,构建多层级框架挖掘隐性知识,设计多模态语义对齐整合多元信息,通过轻量化优化与混合部署降低使用门槛,建立动态机制保障知识迭代。优化后多项关键指标显著提升,为古籍数字化提供有效路径。
|
1天前
| |
来自: 数据库
Umi-OCR_文字识别工具 免安装使用教程(附下载安装包)!永久免费,开源离线OCR识别软件下载
Umi-OCR是一款开源免费、支持离线运行的高精度OCR文字识别工具,基于深度学习技术,可快速识别中文、英文、日文等多种语言。无需联网,保护隐私,适用于Windows和Linux系统,解压即用,操作简便,是处理图片转文本的理想选择。
有了AI叠buff,低代码行业在沉寂了一段时间后,好似又活过来了?
曾被质疑“难堪大用”的低代码平台,在AI驱动下正焕发新生。借助大模型,AI可理解自然语言、自动生成应用、智能补全数据、解析文档图表,大幅提升开发效率与业务响应速度。从“拖拉拽”到“你说我做”,低代码已迈入智能化时代,加速企业数字化转型。
|
1天前
| |
来自: 视觉智能
高效率办公PDF批量处理:批量OCR识别PDF区域文字内容,用PDF内容批量改名或导出表格的货物运单应用案例
针对铁路货运物流单存档需求,本项目基于WPF与飞桨OCR技术,实现批量图片多区域文字识别与自动重命名。用户可自定义识别区域,系统提取关键信息(如车号、批次号)并生成规范文件名,提升档案管理效率与检索准确性,支持PDF及图像文件处理。
|
4天前
| |
来自: 视觉智能
【发票转表格明细】PDF发票提取到表,图片发票提取到表格,扫描件发票提取到表格,全电发票PDF,全电发票扫描件识别导出EXCEL表格数电发票
本文介绍如何一键处理电子发票(PDF)和图片发票,实现自动提取信息、改名并导出Excel表格。支持区域坐标保存复用,批量识别,高效准确,告别手动录入,适合财务人员月末高效处理各类发票。
|
8天前
|
31_NLP数据增强:EDA与NLPAug工具
在自然语言处理(NLP)领域,高质量的标注数据是构建高性能模型的基础。然而,获取大量准确标注的数据往往面临成本高昂、耗时漫长、覆盖度不足等挑战。2025年,随着大模型技术的快速发展,数据质量和多样性对模型性能的影响愈发显著。数据增强作为一种有效扩充训练样本的技术手段,正成为解决数据稀缺问题的关键策略。
PDF解析迎来技术革新!阿里新产品实现复杂文档端到端结构化处理
前言9月24日云栖大会现场,由阿里巴巴爱橙科技数据技术及产品团队自主研发的 PDF解析神器正式亮相并同步开源模型。这款基于Logics-Parsing模型构建的AI工具直指当前PDF解析领域的技术痛点,显著提升复杂文档的结构…
|
12天前
|
《法务RAG开发不踩坑:Kiln+LlamaIndex+Helicone的协同方法指南》
本文记录企业级法务知识库RAG系统的多AI协同开发实战:面对2万份格式混杂、含15%模糊扫描件的法律文档,14天交付需3秒响应精准查询的系统,构建Kiln AI、LlamaIndex、Helicone协同矩阵。Kiln AI完成数据清洗(有效信息密度提至85%)、合成训练样本及模型微调,使专业术语识别准确率达92%;LlamaIndex搭建三层检索架构,融合语义与关键词检索,匹配错误率降至5%,响应时间缩至2.1秒;Helicone优化提示词与推理监控,输出规范率达97%。
免费试用