文字识别的搜索结果_热门_第18页-阿里云开发者社区

菊头蝙蝠

|

博文

Halcon 学习笔记五：几何定位+仿射变换+测量

# 文字识别 # Python

球球不吃虾

|

博文

Uniapp或H5之ORC识别与自定义照相机

# Web App开发 # 移动开发 # 文字识别 # 前端开发 # API

最好zzz

|

博文

基于 Spring Boot 3.3 + OCR 实现图片转文字功能

【8月更文挑战第30天】在当今数字化信息时代，图像中的文字信息越来越重要。无论是文档扫描、名片识别，还是车辆牌照识别，OCR（Optical Character Recognition，光学字符识别）技术都发挥着关键作用。本文将围绕如何使用Spring Boot 3.3结合OCR技术，实现图片转文字的功能，分享工作学习中的技术干货。

# 机器学习/深度学习 # 文字识别 # 前端开发 # Java # Spring

不是海碗

|

博文

|

来自：视觉智能

从图片提取文字的终极解决方法 ——【通用文字识别 API】

通用文字识别技术，也称为OCR（Optical Character Recognition，光学字符识别），就是一种将图像或扫描件中的文字识别出来并转化为可编辑、可搜索的数字化文本的技术。

# 文字识别 # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 文字识别 # 算法 # Java # API # 数据安全/隐私保护 # 计算机视觉

心随而动

|

博文

|

来自：视觉智能

人工智能图像识别四大算子（一）

# 图像识别 # 视觉智能开放平台 # 机器学习/深度学习 # 存储 # 传感器 # 人工智能 # 文字识别 # 算法 # 大数据 # 计算机视觉 # Python

官方小哥

|

博文

ABBYY FineReader PDF 16安装教程2023使用指南及ABBYY16系统配置要求

近年来，随着盲人数字阅读的普及推广，PDF格式的电子书越来越受到大家的关注和喜爱，但受读屏软件功能的限制，扫描版的PDF电子书是无法直接阅读的，这就需要将其转换为可阅读的文档格式，可对于大多数视障读者来说，这似乎有点专业，今天我就为大家推荐一款非常好用的PDF转换利器——ABBYY FineReaderPDF 16(以下简称ABBYY 16)，有了它的支持，我们就可以尽情阅读海量PDF电子书了。

# 文字识别 # 信息无障碍 # iOS开发 # MacOS # Windows

霍格沃兹测试开发muller老师

|

博文

神器！使用Python 轻松识别验证码

本文介绍了使用Python进行验证码识别，主要包括安装Tesseract OCR和相关Python库，如`pytesseract`和`opencv-python`。通过Pillow加载验证码图片，使用`pytesseract`进行简单数字验证码识别。对于数字字母混合的验证码，先进行二值化和降噪处理，然后使用`cv2.findContours`分割字符并分别识别。这种方法适用于自动化测试和爬虫中的验证码处理。

# 数据采集 # 文字识别 # 测试技术 # API # Python

宋晨明

|

11月前

|

博文

PaddleOCR学习笔记 01-PaddleOCR简介

《PaddleOCR学习笔记 01-PaddleOCR简介》涵盖了PaddleOCR的基础介绍、OCR技术概览、PaddleOCR的开源状态及主要算法，包括文字检测与识别算法、百度自研的SAST、SRN和End2End-PSL等，以及9m超轻量模型的介绍。适合初学者入门学习。

# 文字识别 # 算法 # 计算机视觉

vision-cc

|

9月前

|

博文

|

来自： ModelScope模型即服务

行业实践 | 基于Qwen2-VL实现医疗表单结构化输出

本项目针对不同医院检查报告单样式差异大、手机拍摄质量差等问题，传统OCR识别效果不佳的情况，探索并选定了Qwen2-vl系列视觉语言模型。通过微调和优化，模型在识别准确率上显著提升，能够精准识别并结构化输出报告单信息，支持整张报告单及特定项目的识别。系统采用FastAPI封装接口，Gradio构建展示界面，具备高效、灵活的应用特性。未来该方案可扩展至多种文本识别场景，助力行业数字化转型。

# 图像识别 # 人工智能 # 文字识别 # 并行计算 # 异构计算 # Python

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Stirling-PDF：51.4K Star！用Docker部署私有PDF工作站，支持50多种PDF操作，从此告别在线工具

Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具，支持 50 多种 PDF 操作，包括合并、拆分、转换、压缩等，同时提供多语言支持和企业级功能，满足个人和企业用户的多样化需求。

# 自然语言处理 # 人工智能 # 文字识别 # 安全 # Docker # 容器

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别