文字识别

首页 标签 文字识别
# 文字识别 #
关注
5847内容
|
4天前
|
一键搞定人脸识别、语音识别、车牌识别本地化!离线跑模型不装框架!!!
SmartJavaAI 是专为 Java 开发者打造的离线 AI 工具箱,集成人脸识别、OCR、语音识别、机器翻译等 20+ 主流模型,基于 DJL + JNI 封装,支持 Maven 一键引入,两行代码调用,让 Java 工程师无需掌握 Python/C++ 即可轻松接入 AI 能力,高效落地各类智能场景。
|
6天前
|
有没有PDF编辑器支持ORC?这款免费的PDF编辑器就可以做到
这是一款支持多平台的全能PDF工具,兼容安卓、苹果手机及电脑。具备PDF与Word、Excel、PPT、图片等格式互转,支持合并、拆分、压缩及OCR识别,内置AI问答与语音朗读功能,操作便捷,适合各类用户高效处理文档。
|
6天前
|
「睛」准识人:基于Rokid AI眼镜的智能名片识别与管理系统开发实战
本文基于Rokid CXR-M SDK,构建了一套AI眼镜与手机协同的智能名片识别系统,实现名片拍摄、识别、提取与云端管理一体化。涵盖架构设计、核心算法、交互优化与隐私保护,提供AR+AI融合的高效商务解决方案。
混元OCR模型宣布开源,参数仅1B,多项核心能力SOTA
腾讯混元推出全新开源OCR模型HunyuanOCR,仅1B参数,基于原生多模态架构,实现端到端高效推理。在复杂文档解析、文字检测识别等多场景表现卓越,支持14种小语种翻译,广泛适用于票据抽取、视频字幕识别等应用,多项指标达业界SOTA水平。
腾讯混元 HunyuanVideo 1.5 开源!
腾讯混元团队开源HunyuanVideo 1.5,一款8.3B参数的轻量级视频生成模型,基于DiT架构,支持文生视频、图生视频,可在14G显存设备运行,生成5-10秒高清视频,具备强指令响应、流畅动作与电影级画质。
发票验真API:基于权威数据源与阿里云平台的发票验真代码解析
发票验真迈向智能化新阶段,融合OCR识别与权威查验平台,实现全票种自动化验真。一站式接口高效、安全、可溯,支持批量处理与高并发调用,显著提升效率、降低合规风险,助力企业构建智能财税风控体系。(238字)
|
8天前
| |
来自: 视觉智能
2025 年度机器视觉公司有哪些:从技术实力到落地案例的全方位选型参考
在智能制造背景下,机器视觉成为提质增效关键。本文发布2025年度机器视觉公司评估,从技术、场景、服务三大维度解析领先企业方案,聚焦苏州德创测控等代表,涵盖核心技术、落地案例与产教融合,为制造企业选型提供权威参考,助力智能升级。
|
11天前
|
Python实现PDF文档高效转换为HTML文件:从基础到进阶的完整指南
本文详解PDF转HTML的必要性及Python三大技术方案:Spire.PDF、PyMuPDF与pdf2htmlEX,涵盖电商实战案例、性能优化、常见问题解决及OCR集成、自动化部署等进阶技巧,助力高效构建文档转换系统。
|
11天前
| |
来自: 计算巢
PowerToys微软官方效率工具实操教程!Windows系统增强神器!
PowerToys是微软官方推出的免费开源工具集,集成20余款高效插件,如窗口管理、快速启动、批量重命名、OCR文字提取等,显著提升Windows使用体验,支持多屏协作、快捷操作,安全稳定,持续更新,适合各类用户优化工作效率。
ModelScope魔搭社区发布月报 -- 25年11月
魔搭ModelScope三周年庆!见证开源大模型从追赶到领跑,11月硬核更新不断:Qwen3-VL、MiniMax-M2等新模态齐发,AIGC生态爆发,OCR、语音、Agent全面进化。11月22日杭州AI开源生态大会,不见不散!
免费试用