文字识别的搜索结果_文章_第6页-阿里云开发者社区

cuicuicuic

|

2月前

|

博文

|

来自：视觉智能

文字识别OCR常见问题之买了资源包识别不成功扣次数如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

# 文字识别 # 文字识别 # API # 开发工具

cuicuicuic

|

2月前

|

博文

|

来自：视觉智能

文字识别OCR常见问题之图片超过40M不返回结果如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

# 文字识别 # 存储 # 文字识别 # 算法 # 前端开发

cuicuicuic

|

2月前

|

博文

|

来自：视觉智能

文字识别OCR常见问题之pos节点的x y好像不准确如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

# 文字识别 # 人工智能 # 文字识别 # 数据可视化 # API

cuicuicuic

|

2月前

|

博文

|

来自：视觉智能

文字识别OCR常见问题之卡证票据包含营业执照如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

# 文字识别 # 文字识别

cuicuicuic

|

2月前

|

博文

|

来自：视觉智能

文字识别OCR常见问题之调试一直报401错如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

# 文字识别 # 文字识别 # 监控 # API # 开发工具

千里一游

|

2月前

|

博文

|

来自：视觉智能

关于github开源ocr项目的疑问

小白尝试Python OCR学习，遇到报错。尝试Paddle OCR部署失败，Tesseract OCR在Colab误操作后恢复失败。EasyOCR在Colab和阿里天池Notebook成功，但GPU资源不足。其他平台部署不顺，决定使用WebUI或阿里云轻应用。求教OCR项目部署到本地及简单OCR项目推荐。

# 人工智能 # 文字识别 # 异构计算 # Python

cuicuicuic

|

2月前

|

博文

|

来自：视觉智能

文字识别OCR常见问题之运行的时候报.ClassNotFoundException如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

# 文字识别 # 文字识别 # 算法 # Java # 开发工具 # Maven

cuicuicuic

|

2月前

|

博文

|

来自：视觉智能

文字识别OCR常见问题之报错403如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

# 文字识别 # 存储 # JSON # 文字识别 # API # 数据格式

java知路

|

2月前

|

博文

java调用tess4j识别图像中的文字

# 文字识别 # Java # Maven # 开发者

阿里云大数据Al技术

|

2月前

|

博文

|

来自：大数据与机器学习

【AAAI 2024】M2Doc：文档版面分析的可插拔多模态融合方法

M2Doc是一种创新的多模态融合方法，设计用于增强文档版面分析任务中的纯视觉目标检测器。该方法包括Early-Fusion和Late-Fusion模块，前者通过门控机制融合视觉和文本特征，后者则在框级别合并这两种特征。M2Doc易于集成到各种目标检测器，实验证明它能显著提升DocLayNet和M6Doc数据集上的性能，特别是与DINO结合时，在多个数据集上达到SOTA结果。此外，研究表明M2Doc对于增强复杂逻辑版面分析任务中的文本理解和语义关联特别有效。

# 人工智能平台 PAI # 人工智能 # 文字识别 # 计算机视觉