文字识别的搜索结果-阿里云开发者社区

Deephub

|

1小时前

|

博文

在计算机视觉落地中，模型性能下降常源于预处理缺陷。本文基于scikit-image总结十大工程化模式：统一数据类型、显式颜色空间、抗锯齿缩放、CLAHE增强、去噪选择、去偏斜、背景去除、智能二值化、形态学清理与几何归一化，系统化提升输入质量，让模型真正发挥效能。

# 文字识别 # 监控 # 算法 # API # 计算机视觉

聊聊RPA丨实在智能

|

2天前

|

博文

别再手动对账了！rpa财务机器人软件如何实现“易用、实用、好用”？

RPA财务机器人软件正重塑财务工作，通过自动化处理重复、规则明确的任务，如对账、报税、报销审核等，大幅提升效率与准确性。它非物理机器人，而是一套模拟人工操作的程序，可7×24小时运行，助力财务从“手工时代”迈向“智能时代”。尤其适合高频、稳定、标准化流程，已成为企业降本增效的核心工具。

# 机器人流程自动化 # 人工智能 # 自然语言处理 # 文字识别 # Cloud Native # 机器人

数眼智能AI

|

2天前

|

博文

还在研究部署PaddleOCR？数眼智能OCR文档解析API上线：免费使用！

数眼智能推出新一代OCR文档解析API，突破传统OCR局限，融合多模态识别与深度学习，精准还原PDF、扫描件中的文字、表格、公式等结构，直接输出带层级的Markdown与JSON数据。实现标题、段落、表格自动分离，助力大模型知识库构建、金融报表分析、学术文献处理等场景，10秒内高效响应，让纸质文档秒变智能数据资产。

# 机器学习/深度学习 # JSON # 文字识别 # API # 数据格式

阿里云-分析师关系团队

|

4天前

|

博文

蝉联六冠，阿里云金融云市场第一

国际数据公司（IDC）《中国金融云市场（2025上半年）跟踪》最新报告，2025上半年阿里云凭借金融全栈AI云领跑市场，以20.4%的份额再次夺冠，增速高达32%。自2019H1以来，阿里云已连续6年蝉联中国金融云整体市场第一。

# 人工智能 # 自然语言处理 # 运维 # 文字识别 # 安全

bailiantest1

|

9天前

|

博文

|

来自：通义大模型

Qwen3-Omni新升级:声形意合，令出智随！

Qwen3-Omni-Flash-2025-12-01是全新升级的全模态大模型，支持文本、图像、音频、视频输入，实现自然语音与文本同步输出。全面优化音视频理解与生成，支持多轮流畅对话、自定义人设与系统指令，提升多语言及跨模态交互准确性，语音更拟人，图像视频理解更深入，打造“声形意合”的智能交互体验。（239字）

# 大模型服务平台百炼 # 人工智能 # 自然语言处理 # 文字识别 # 语音技术

HELLO程序员

|

9天前

|

博文

|

来自：阿里云百炼

技术赋能医药全链路：AI 大模型应用在药企的落地痛点与破局之道

本文阐述AI技术在制药行业的深度变革，涵盖企业微信私有化部署、CRM系统智能升级、Data-Agent演进等全链路转型实践，结合RAG优化与幻觉控制方案，推动业务提效与合规双提升，展现AI赋能下行业模式的重塑路径。

# 大模型服务平台百炼 # 数据采集 # 人工智能 # 自然语言处理 # 文字识别 # 安全

公有云小学生

|

10天前

|

博文

|

来自：通义大模型

通过人工智能平台PAI部署DeepSeek-OCR模型官网控制台部署

本方案介绍如何在阿里云PAI平台部署DeepSeek-OCR开源模型，涵盖从账号准备、模型部署到应用体验的完整流程。通过PAI的Model Gallery可一键部署，结合PAI-EAS实现高性能推理，支持公网调用。适用于OCR场景快速搭建与测试，体验后建议及时清理资源以避免计费。

# 大模型服务平台百炼 # 人工智能 # 文字识别 # 运维 # 监控 # 异构计算

1623789125455094

|

10天前

|

博文

|

来自：物联网

报关单OCR识别-进出口海关报关单识别接口返回参数-文字识别

报关单识别接口基于OCR与深度学习技术，精准提取进出口报关单关键信息，输出结构化数据。支持API调用与私有化部署，适用于智能通关、跨境物流等场景，提升申报效率与准确性。

# 文字识别 # 机器学习/深度学习 # 文字识别 # 算法 # Java # API

Hi梅

|

11天前

|

博文

验证码识别

基于Spring Boot与ONNX Runtime的OCR服务，支持D4NEW/D4OLD引擎，提供RESTful API，兼容Base64、URL及文件上传，集成Swagger文档，具备多环境配置、日志管理与跨域支持，易于扩展与部署。

# 文字识别 # 安全 # Java # API # Maven

AI先锋

|

12天前

|

博文

降低AI幻觉，破解非结构化数据之困：司马阅自研模型DocMind-V3.0加速重塑企业数据价值

数字经济时代，数据是企业的核心竞争力，80%以上的企业数据深藏于制度、合同、报表、标书、扫描件等各类文档中。这些非结构化“沉默数据”如未被开采金矿，因无法被机器直接理解、调用，成为企业AI落地的“堵点”。大语言模型为处理这类数据提供新可能，但企业在AI落地过程中，常常被AI幻觉“绊住”：大语言模型会“自信地犯错”，会“帮你凑一个看似合理的答案”，即大模型会基于模糊信息生成偏离事实的内容，导致数据应用失真，无法支撑精准决策与合规要求，其根本原因在于输入数据质量太低。数据处理遵循“GIGO（垃圾进垃圾出）”原则，低质量无规范输入，再强的模型也难输出可靠结果。

# 数据采集 # 人工智能 # 文字识别 # 安全 # 数据处理

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别