文字识别的搜索结果_文章-阿里云开发者社区

蚝油菜花

|

2月前

|

博文

|

来自： ModelScope模型即服务

moonshot-v1-vision-preview：月之暗面Kimi推出多模态视觉理解模型，支持图像识别、OCR文字识别、数据提取

moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型，具备强大的图像识别、OCR文字识别和数据提取能力，支持API调用，适用于多种应用场景。

# 文字识别 # 人工智能 # 文字识别 # API # Python

哈德门66

|

3月前

|

博文

实战阿里通义灵码极速编程-截屏-OCR-OLlama篇

通过实际案例展示阿里通义灵码如何极大提高编程效率。以开发屏幕截图OCR Python程序为例，使用Win10、Anaconda3、VS Code及通义灵码插件。经过四次提问与优化，从截屏选择矩形区域到调用大模型进行OCR识别，整个过程仅耗时半小时，最终形成可运行的控制台程序。加入界面开发后，总用时2小时，显著提升开发速度和质量。

# 文字识别 # 文字识别 # 程序员 # C++ # Python

阿里云开发者

|

3月前

|

博文

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

# 文字识别 # JSON # 文字识别 # API # 对象存储 # 数据格式

1778908750453455

|

4月前

|

博文

7大核心技术：智能OCR如何助力市政单位文档处理数字化转型

随着政务服务数字化的推进，市政单位面临复杂的文档处理需求。本文介绍了一种基于智能OCR技术的一站式文档处理方案，涵盖数据矫正、通用文字识别、表格与票据结构化提取、卡证分类、印章检测、手写文字识别及图像内容识别等核心技术，显著提升工作效率与文档解析的准确性。

# 文字识别 # 机器学习/深度学习 # 数据采集 # 文字识别 # 算法 # 计算机视觉

1778908750453455

|

4月前

|

博文

AI与OCR：数字档案馆图像扫描与文字识别技术实现与项目案例

本文介绍了纸质档案数字化的技术流程，包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取，以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术，提高图像质量，确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储，实现了高效、准确的档案数字化。具体应用案例显示，该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。

# 文字识别 # 存储 # 人工智能 # 文字识别 # 算法 # 数据库

左诗右码

|

4月前

|

博文

Python中的文字识别利器：pytesseract库

`pytesseract` 是一个基于 Google Tesseract-OCR 引擎的 Python 库，能够从图像中提取文字，支持多种语言，易于使用且兼容性强。本文介绍了 `pytesseract` 的安装、基本功能、高级特性和实际应用场景，帮助读者快速掌握 OCR 技术。

# 文字识别 # 文字识别 # 自然语言处理 # API # 计算机视觉 # Python

技术自由圈/原疯狂创客圈

|

5月前

|

博文

SpringCloud+Python 混合微服务，如何打造AI分布式业务应用的技术底层？

尼恩，一位拥有20年架构经验的老架构师，通过其深厚的架构功力，成功指导了一位9年经验的网易工程师转型为大模型架构师，薪资逆涨50%，年薪近80W。尼恩的指导不仅帮助这位工程师在一年内成为大模型架构师，还让他管理起了10人团队，产品成功应用于多家大中型企业。尼恩因此决定编写《LLM大模型学习圣经》系列，帮助更多人掌握大模型架构，实现职业跃迁。该系列包括《从0到1吃透Transformer技术底座》、《从0到1精通RAG架构》等，旨在系统化、体系化地讲解大模型技术，助力读者实现“offer直提”。此外，尼恩还分享了多个技术圣经，如《NIO圣经》、《Docker圣经》等，帮助读者深入理解核心技术。

# 容器服务Kubernetes版 # 文字识别 # 云原生大数据计算服务 MaxCompute # 人工智能 # 文字识别 # Java # Python # 微服务

不吃核桃

|

7月前

|

博文

|

来自：视觉智能

视觉智能开放平台产品使用合集之海外是否可以访问人物动漫化的api版本

视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台，这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API，快速将视觉智能功能集成到自己的应用或服务中，而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。

# 文字识别 # 视觉智能开放平台 # 文字识别 # 算法 # API # 开发者 # 计算机视觉

萝卜丝丸子

|

7月前

|

博文

|

来自：视觉智能

视觉智能开放平台产品使用合集之如何提高人脸活体检测的识别率

视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台，这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API，快速将视觉智能功能集成到自己的应用或服务中，而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。

# 文字识别 # 视觉智能开放平台 # 存储 # 文字识别 # API # 开发工具 # Android开发

游客wkzdk2qklv76k

|

7月前

|

博文

第3章计算机视觉基础

这篇文章是计算机视觉基础的介绍，涵盖了计算机视觉的概念、应用场景、挑战，以及常见的计算机视觉任务（如图像分类、目标检测、图像分割、OCR、视频分析和图像生成），并通过PaddleHub工具提供了快速实践的指南。

# 文字识别 # 机器学习/深度学习 # 编解码 # 文字识别 # 算法 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别