文字识别的搜索结果_第8页-阿里云开发者社区

yunmai

|

4月前

|

博文

OCR（光学字符识别）技术是数字化浪潮中的关键工具，可将纸质文档、手写笔记或复杂背景下的文字图像转化为可编辑文本。本文从图像采集、预处理、字符识别到文本校正，全面解析OCR技术的原理，并探讨其在智能办公、智慧交通、便捷生活等领域的广泛应用。未来，OCR将与自然语言处理、计算机视觉等技术深度融合，推动智能化和综合化发展。通过开放生态系统和政策支持，开发者可探索更多创新场景，如古籍数字化、盲人阅读等，为社会带来更多价值。

# 文字识别 # 机器学习/深度学习 # 文字识别 # 自然语言处理 # 算法 # 开发者

游客3ovjb4ylkci6m

|

4月前

|

问答

|

来自：视觉智能

调用【身份证OCR文字】接口返回403(Forbidden)

# 视觉智能开放平台 # 文字识别

深圳快瞳科技有限公司

|

4月前

|

博文

|

来自：大数据与机器学习

python做ocr卡证识别很简单

本示例展示了如何使用 `potencent` 库调用腾讯云 OCR 服务识别银行卡和身份证信息。代码中分别通过本地图片路径 (`img_path`) 和配置文件 (`potencent-config.toml`) 实现了银行卡和身份证的 OCR 识别，并输出结果。测试图片及结果显示了识别效果，需提前配置腾讯云的 `SECRET_ID` 和 `SECRET_KEY`。

# 文字识别 # Python

Deephub

|

4月前

|

博文

|

来自：大数据与机器学习

SmolDocling技术解析：2.56亿参数胜过70亿参数的轻量级文档处理模型

SmolDocling是由HuggingFace与IBM联合研发的超紧凑视觉模型，专为端到端文档转换设计。基于SmolVLM-256M开发，参数量仅2.56亿，却媲美大型模型性能。其核心创新在于DocTags格式，一种类XML标记语言，能全面表示文档内容与结构。SmolDocling通过端到端架构实现图像理解与文本生成整合，在文档分类、OCR、布局分析等任务中表现出色。评估显示，其在多项指标上优于大参数量模型，适用于资源受限场景，推动文档处理技术发展。

# 云解析DNS # XML # 自然语言处理 # 文字识别 # 数据格式 # 计算机视觉

耀骑士

|

4月前

|

博文

搬运5款让你眼前一亮的神器软件

本文推荐了五款小众但实用的软件，涵盖多种需求：GoodSync实现跨端文件同步与备份，采用高效加密技术；Cryptomator提供云盘文件加密保护，确保数据安全；3171.cn集成多种在线AI工具，助力办公学习；OneNote作为全能笔记工具，支持多平台协作与智能管理；EasyRecovery专注数据恢复，解决误删或格式化问题。这些软件功能强大且经过测试，值得尝试。

# 人工智能 # 文字识别 # 算法 # 固态存储 # 数据安全/隐私保护

yaaakaaang

|

4月前

|

博文

车在路上必有证！AI自动识别驾驶证

经常开车的朋友都知道，持证驾驶很重要，从各种意义上来说都是这样。今天咱就谈谈AI识别驾驶证

# 人工智能 # 文字识别 # 小程序

yaaakaaang

|

4月前

|

博文

用AI自动识别社保卡，让数据处理更高效！

在上次分享的发票识别工具之后，许多用户反馈希望能够扩展功能，支持其他类型证件的识别，比如社保卡。

# 人工智能 # 文字识别 # 小程序 # 数据处理

灵杰开发者

|

4月前

|

博文

|

来自：大数据与机器学习

阿里云 AI 搜索开放平台新增：服务开发能力

阿里云 AI 搜索开放平台新发布：服务开发能，可通过集成 dsw 能力并新增 notebook 功能，进一步提升用户编排效率。

# 人工智能 # 自然语言处理 # 文字识别 # 搜索推荐 # API

yaaakaaang

|

4月前

|

博文

告别手动录入！AI自动识别发票

最近有朋友向我吐槽："每天对着几十张发票手动录入系统，眼睛都快看花了，还总担心数字打错。" 这种重复性高、容错率低的工作，确实让财务和行政人员苦不堪言。作为程序员，我深知这类场景完全可以通过技术手段优化

# 人工智能 # 文字识别 # 小程序 # 程序员

RaceSnail

|

4月前

|

博文

飞桨x昇腾生态适配方案：03_模型训练迁移

本案例以PaddleOCRv4模型为例，详细介绍了将模型迁移到NPU的完整流程。迁移过程中需确保模型功能在新硬件上无误，重点关注偶发性错误及长时间运行时可能出现的问题，并通过日志辅助定位问题。文档涵盖环境搭建、数据集准备、模型配置、训练启动及常见问题排查等内容。例如，通过设置环境变量排查缺失算子，处理Paddle版本兼容性问题，以及解决进程残留等。适合希望将OCR模型部署到NPU的开发者参考。

# 存储 # 文字识别 # 文件存储 # 开发者 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别