文字识别的搜索结果_热门_第19页-阿里云开发者社区

不是海碗

|

博文

一文带你看透IP归属地

IP归属地查询在各大行业当中的利用率可以说非常的高了，提供了各种的保障，比如安全保障、数据保障、性能保障等等。在这就可以推荐使用APISpace的IP归属地服务，上面各行业的应用场景都是可以很好的覆盖到。

# 云解析DNS # 数据采集 # 文字识别 # 网络协议 # 安全 # 视频直播 # 定位技术 # API # 调度 # 数据中心 # CDN

嵌入式软件开发

|

博文

一文搞懂SDIO

SDIO(Secure Digital Input and Output)，即安全数字输入输出接口。它是在SD卡接口的基础上发展而来，它可以兼容之前的SD卡，并可以连接SDIO接口设备，比如：蓝牙、WIFI、GPS等。

# 存储 # 文字识别 # 安全 # 定位技术 # 索引

5i77ajz5u7ji6

|

博文

MLLM首篇综述 | 一文全览多模态大模型的前世、今生和未来

# 自然语言处理 # 存储 # 自然语言处理 # 文字识别 # 数据可视化 # 语音技术

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Umi-OCR：31K Star！离线OCR终结者！公式+二维码+多语种，开源免费吊打付费

Umi-OCR 是一款免费开源的离线 OCR 文字识别工具，支持截图、批量图片、PDF 扫描件的文字识别，内置多语言识别库，提供命令行和 HTTP 接口调用功能。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 文字识别 # 自然语言处理 # 算法

CV技术指南（公众号）

|

博文

|

来自：视觉智能

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

OCR文字识别在目前有着比较好的应用，也出现了很多的文字识别软件，但软件是面向用户的。对于我们技术人员来说，有时难免需要在计算机视觉任务中加入文字识别，如车牌号识别，票据识别等，因此软件对我们是没用的，我们需要自己实现文字识别。

# 文字识别 # 视觉智能开放平台 # 文字识别 # 计算机视觉 # C++ # Python

三分钟热度的鱼

|

问答

|

来自：视觉智能

请问文字识别OCR的TaskId这个参数是什么意思？不是只要唯一就可以吗？

# 文字识别 # 视觉智能开放平台 # 文字识别

GoAlaaa

|

博文

|

来自：视觉智能

OCR文字识别方法综述

摘要：文字识别可以把海量非结构化数据转换为结构化数据，从而支撑各种创新的人工智能应用，是计算机视觉研究领域的分支之一，其任务是识别出图像中的文字内容，一般输入来自于文本检测得到的文本框截取出的图像文字区域。近几年来，基于深度学习的文字识别算法模型已取得不错成果，其过程无需进行特征处理且可以实现复杂场景文字识别，效果要优于传统文字识别方法，逐渐成为文字识别研究应用的主流方式。本文将主要介绍基于深度学习的文字识别技术综述，分类总结主流文字识别经典算法，讨论未来文字识别领域发展与研究趋势。

# 文字识别 # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 文字识别 # 自然语言处理 # 算法 # 数据挖掘 # 图形学 # 计算机视觉

带你读小助手

|

博文

关键帧提取 | 学习笔记

快速学习关键帧提取，介绍了关键帧提取系统机制，以及在实际应用过程中如何使用。

# 文字识别 # 算法 # 计算机视觉 # 开发者 # 索引

yuanzhengme

|

博文

Java图片信息识别

【5月更文挑战第26天】Java图片信息识别

# 文字识别 # Java # API # 开发工具 # 计算机视觉

老乡别走

|

7月前

|

博文

|

来自：视觉智能

【图片型PDF】批量识别扫描件PDF指定区域局部位置内容，将识别内容导出Excel表格或批量改名文件，基于阿里云OCR对图片型PDF识别改名案例实现

在医疗和政务等领域，图片型PDF文件（如病历、报告、公文扫描件）的处理需求广泛。通过OCR技术识别这些文件中的文字信息，提取关键内容并保存为表格，极大提高了信息管理和利用效率。本文介绍一款工具——咕嘎批量OCR系统，帮助用户快速处理图片型PDF文件，支持区域识别、内容提取、导出表格及批量改名等功能。下载工具后，按步骤选择处理模式、进行区域采样、批量处理文件，几分钟内即可高效完成数百个文件的处理。

# 视觉智能开放平台 # 文字识别 # BI

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别