文字识别

首页 标签 文字识别
# 文字识别 #
关注
5992内容
PDF转换成Word后乱码怎么办?
我们在把PDF文档转换为Word的过程中,偶尔会遇到PDFelement转换后乱码或者排版混乱的现象,给我们造成了极大的困扰。 为什么PDF转换成Word会乱码?乱码了之后要怎么办呢?下面就由软发网为大家讲解一下。
DeepSeek 里的公式怎么复制到 Word、WPS?保留 LaTeX 和可编辑公式的方法
DeepSeek公式复制到Word/WPS常遇格式错乱、不可编辑等问题。本文详解用DeepShare插件按目标软件(Word/WPS/MathType/Markdown工具)选择LaTeX、Markdown或原生格式一键复制,保留可编辑性与专业排版,提升数理文档整理效率。
文本识别 (OCR)引擎之Tesseract的使用
esseract是一个开源文本识别 (OCR)引擎,用于识别图片中的文字并将其转换为可编辑的文本。
Qwen3-VL新成员 2B、32B来啦!更适合开发者体质
Qwen3-VL家族重磅推出2B与32B双版本,轻量高效与超强推理兼备,一模型通吃多模态与纯文本任务!
0.9B 小模型,OCR 大能力——GLM-OCR 模型实战教程
智谱开源多模态OCR模型GLM-OCR,基于GLM-V架构,融合CogViT视觉编码器与GLM-0.5B语言解码器,支持公式、表格、代码等复杂文档识别,性能达OmniDocBench榜首(94.62分),仅0.9B参数,轻量高效,开箱即用。
阿里云AI产品免费试用活动介绍:超30款AI产品和7000万大模型 tokens 免费体验
阿里云2026年面向产品新用户推出的AI免费试用活动,提供超30款AI产品和7000万大模型tokens免费体验,零成本构建AI应用。核心权益包括:通义千问3系列、Qwen3-Coder、万相-Image等150+款大模型免费使用,100+Agent模板开箱即用,PAI平台一键部署大模型,以及NLP自然语言处理、视觉智能等10余款产品最长12个月免费试用。
阿里云AI产品与相关大模型活动参考:免费领Tokens,AI产品试用、大模型节省计划介绍
2026年截至目前阿里云AI产品及大模型服务的主要活动参考:AI订阅方面,Token Plan提供198-1398元/月三档套餐,Coding Plan Pro高级套餐200元/月限量发售;HappyHorse视频生成模型限时8折。免费试用提供超30款AI产品及7000万Tokens,涵盖Agent开发、图文生成、代码生成等。成本优化方面,全模型通用抵扣低至10元/月,AI通用型节省计划最高可享5.3折。此外还有"先用后返"优惠券活动,最高返200元。
论文推荐|[NAACL 2019] 基于图卷积网络的视觉富文本数据中文档图像信息抽取
简要介绍NAACL 2019录用论文“Graph Convolution for Multimodal Information Extraction from Visually Rich Documents”的主要工作。该论文主要针对视觉富文本数据的信息抽取问题,提出了一种图卷积网络,结合文本信息与视觉信息,取得了比纯文本方法更好的效果。
Mobile-Agent:通过视觉感知实现自动化手机操作,支持多应用跨平台
Mobile-Agent 是一款基于多模态大语言模型的智能代理,能够通过视觉感知自主完成复杂的移动设备操作任务,支持跨应用操作和纯视觉解决方案。
免费试用