文字识别的搜索结果_文章_第3页-阿里云开发者社区

游客ad6gaysewwv26

|

1月前

|

博文

有了AI叠buff，低代码行业在沉寂了一段时间后，好似又活过来了？

曾被质疑“难堪大用”的低代码平台，在AI驱动下正焕发新生。借助大模型，AI可理解自然语言、自动生成应用、智能补全数据、解析文档图表，大幅提升开发效率与业务响应速度。从“拖拉拽”到“你说我做”，低代码已迈入智能化时代，加速企业数字化转型。

# 人工智能 # 文字识别 # 自然语言处理 # 数据可视化 # JavaScript

老乡别走

|

1月前

|

博文

|

来自：视觉智能

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

针对铁路货运物流单存档需求，本项目基于WPF与飞桨OCR技术，实现批量图片多区域文字识别与自动重命名。用户可自定义识别区域，系统提取关键信息（如车号、批次号）并生成规范文件名，提升档案管理效率与检索准确性，支持PDF及图像文件处理。

# 视觉智能开放平台 # 机器学习/深度学习 # 文字识别 # Shell # C# # Python

aliyun9170107523-43660

|

1月前

|

博文

31_NLP数据增强：EDA与NLPAug工具

在自然语言处理（NLP）领域，高质量的标注数据是构建高性能模型的基础。然而，获取大量准确标注的数据往往面临成本高昂、耗时漫长、覆盖度不足等挑战。2025年，随着大模型技术的快速发展，数据质量和多样性对模型性能的影响愈发显著。数据增强作为一种有效扩充训练样本的技术手段，正成为解决数据稀缺问题的关键策略。

# 数据采集 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 文字识别

modelscope

|

2月前

|

博文

|

来自： ModelScope模型即服务

PDF解析迎来技术革新！阿里新产品实现复杂文档端到端结构化处理

前言9月24日云栖大会现场，由阿里巴巴爱橙科技数据技术及产品团队自主研发的 PDF解析神器正式亮相并同步开源模型。这款基于Logics-Parsing模型构建的AI工具直指当前PDF解析领域的技术痛点，显著提升复杂文档的结构…

# 云解析DNS # 存储 # 人工智能 # 文字识别 # 数据可视化 # 云栖大会

技术员阿伟

|

2月前

|

博文

《法务RAG开发不踩坑：Kiln+LlamaIndex+Helicone的协同方法指南》

本文记录企业级法务知识库RAG系统的多AI协同开发实战：面对2万份格式混杂、含15%模糊扫描件的法律文档，14天交付需3秒响应精准查询的系统，构建Kiln AI、LlamaIndex、Helicone协同矩阵。Kiln AI完成数据清洗（有效信息密度提至85%）、合成训练样本及模型微调，使专业术语识别准确率达92%；LlamaIndex搭建三层检索架构，融合语义与关键词检索，匹配错误率降至5%，响应时间缩至2.1秒；Helicone优化提示词与推理监控，输出规范率达97%。

# 数据采集 # 人工智能 # 文字识别 # 监控 # 数据处理

聚客AI

|

2月前

|

博文

|

来自：阿里云百炼

从CLIP到GPT-4V：多模态RAG背后的技术架构全揭秘

本文深入解析多模态RAG技术，涵盖其基本原理、核心组件与实践路径。通过整合文本、图像、音频等多源信息，实现跨模态检索与生成，拓展AI应用边界。内容详实，建议收藏学习。

# 数据采集 # 人工智能 # 文字识别 # 数据库 # 索引

阿里云开发者

|

2月前

|

博文

你们催更的模型，云栖大会一口气全发了！

通义发布6款全新模型及“通义百聆”语音品牌，覆盖文本、视觉、语音、视频、代码、图像全场景。Qwen系列升级显著提升多模态理解与生成能力，Wan2.5支持音画同步，百聆攻克企业语音落地难题，全面赋能AI应用创新。

# 人工智能 # 自然语言处理 # 文字识别 # 云栖大会 # 语音技术

AI研究者手札

|

2月前

|

博文

面向古籍版面数字化识别应用研究—基于HisDoc-DETR模型深入剖析

针对古籍版面复杂、文字稀疏、数据稀缺等难题，合合信息与华南理工大学联合提出HisDoc-DETR模型。该框架融合Transformer全局建模与CNN局部特征提取优势，创新引入语义关系学习、双流特征融合及GIoU感知预测头三大模块，显著提升古籍逻辑与物理结构的识别精度，在SCUT-CAB数据集上性能超越主流方法，为古籍数字化、知识库构建与文化遗产传播提供强有力的技术支撑。

# 机器学习/深度学习 # 文字识别 # 算法 # 数据可视化 # 计算机视觉

游客eowof6ca4zztg

|

2月前

|

博文

如何开发车辆管理系统中的加油管理板块（附架构图+流程图+代码参考）

本文针对中小企业在车辆加油管理中常见的单据混乱、油卡管理困难、对账困难等问题，提出了一套完整的系统化解决方案。内容涵盖车辆管理系统（VMS）的核心功能、加油管理模块的设计要点、数据库模型、系统架构、关键业务流程、API设计与实现示例、前端展示参考（React + Antd）、开发技巧与工程化建议等。通过构建加油管理系统，企业可实现燃油费用的透明化、自动化对账、异常检测与数据分析，从而降低运营成本、提升管理效率。适合希望通过技术手段优化车辆管理的企业技术人员与管理者参考。

# JSON # 文字识别 # BI # API # 数据库

站大爷

|

2月前

|

博文

Python实现PDF图片OCR识别：从原理到实战的全流程解析

本文详解2025年Python实现扫描PDF文本提取的四大OCR方案（Tesseract、EasyOCR、PaddleOCR、OCRmyPDF），涵盖环境配置、图像预处理、核心识别与性能优化，结合财务票据、古籍数字化等实战场景，助力高效构建自动化文档处理系统。

# 云解析DNS # 机器学习/深度学习 # 文字识别 # Java # 异构计算 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别