文字识别的搜索结果_热门_第16页-阿里云开发者社区

终流击水

|

博文

PDF转换成Word后乱码怎么办？

我们在把PDF文档转换为Word的过程中，偶尔会遇到PDFelement转换后乱码或者排版混乱的现象，给我们造成了极大的困扰。为什么PDF转换成Word会乱码？乱码了之后要怎么办呢？下面就由软发网为大家讲解一下。

# 文字识别 # 文字识别

技术内容小助手

|

博文

Qwen2.5-VL！Qwen2.5-VL！！Qwen2.5-VL！！！

# 机器学习/深度学习 # 编解码 # JSON # 文字识别 # 数据格式

北冥有于啊-31500

|

23天前

|

博文

DeepSeek 里的公式怎么复制到 Word、WPS？保留 LaTeX 和可编辑公式的方法

DeepSeek公式复制到Word/WPS常遇格式错乱、不可编辑等问题。本文详解用DeepShare插件按目标软件（Word/WPS/MathType/Markdown工具）选择LaTeX、Markdown或原生格式一键复制，保留可编辑性与专业排版，提升数理文档整理效率。

# 机器学习/深度学习 # 人工智能 # 文字识别 # Windows

CodeDevMaster

|

博文

文本识别 (OCR)引擎之Tesseract的使用

esseract是一个开源文本识别 (OCR)引擎，用于识别图片中的文字并将其转换为可编辑的文本。

# 文字识别 # 机器学习/深度学习 # 文字识别 # 算法 # Linux # Windows

modelscope

|

8月前

|

博文

|

来自： ModelScope模型即服务

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Qwen3-VL家族重磅推出2B与32B双版本，轻量高效与超强推理兼备，一模型通吃多模态与纯文本任务！

# 文字识别 # 测试技术 # 开发者

modelscope

|

4月前

|

博文

|

来自： ModelScope模型即服务

0.9B 小模型，OCR 大能力——GLM-OCR 模型实战教程

智谱开源多模态OCR模型GLM-OCR，基于GLM-V架构，融合CogViT视觉编码器与GLM-0.5B语言解码器，支持公式、表格、代码等复杂文档识别，性能达OmniDocBench榜首（94.62分），仅0.9B参数，轻量高效，开箱即用。

# 机器学习/深度学习 # JSON # 文字识别 # 开发工具 # Python

云小子来社区

|

23天前

|

博文

|

来自：阿里云百炼

阿里云AI产品免费试用活动介绍：超30款AI产品和7000万大模型 tokens 免费体验

阿里云2026年面向产品新用户推出的AI免费试用活动，提供超30款AI产品和7000万大模型tokens免费体验，零成本构建AI应用。核心权益包括：通义千问3系列、Qwen3-Coder、万相-Image等150+款大模型免费使用，100+Agent模板开箱即用，PAI平台一键部署大模型，以及NLP自然语言处理、视觉智能等10余款产品最长12个月免费试用。

# 大模型服务平台百炼 # 人工智能 # 自然语言处理 # 文字识别 # 算法 # 测试技术

云计算学习者

|

15天前

|

博文

|

来自：阿里云百炼

2026年截至目前阿里云AI产品及大模型服务的主要活动参考：AI订阅方面，Token Plan提供198-1398元/月三档套餐，Coding Plan Pro高级套餐200元/月限量发售；HappyHorse视频生成模型限时8折。免费试用提供超30款AI产品及7000万Tokens，涵盖Agent开发、图文生成、代码生成等。成本优化方面，全模型通用抵扣低至10元/月，AI通用型节省计划最高可享5.3折。此外还有"先用后返"优惠券活动，最高返200元。

# 大模型服务平台百炼 # 人工智能 # 编解码 # 自然语言处理 # 文字识别 # 开发者

AI文字识别

|

博文

简要介绍NAACL 2019录用论文“Graph Convolution for Multimodal Information Extraction from Visually Rich Documents”的主要工作。该论文主要针对视觉富文本数据的信息抽取问题，提出了一种图卷积网络，结合文本信息与视觉信息，取得了比纯文本方法更好的效果。

# 文字识别 # 文字识别

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Mobile-Agent：通过视觉感知实现自动化手机操作，支持多应用跨平台

Mobile-Agent 是一款基于多模态大语言模型的智能代理，能够通过视觉感知自主完成复杂的移动设备操作任务，支持跨应用操作和纯视觉解决方案。

# 图像识别 # XML # 人工智能 # 文字识别 # 自然语言处理 # 决策智能

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别