文字识别的搜索结果_文章-阿里云开发者社区

modelscope

|

10小时前

|

博文

|

来自： ModelScope模型即服务

全新框架 Glyph 开源：用视觉理解文本，3–4 倍上下文压缩，近 5 倍推理提速！

清华CoAI与智谱AI提出Glyph新范式，将长文本渲染为图像，通过视觉语言模型实现高效长上下文处理。3-4倍压缩比，性能媲美主流大模型，显存占用降2/3，低成本支持百万token任务，开源可商用。

# 机器学习/深度学习 # 人工智能 # 文字识别

小华同学ai

|

11小时前

|

博文

牛逼，DeepSeek-OCR 最新免费，引爆文档处理效率的黑科技模型

小华同学推荐：DeepSeek-OCR，由DeepSeek-AI开源的高效OCR工具，支持视觉压缩编码、结构化输出（如Markdown），可批量处理海量文档，适配PDF/图片，兼容vLLM，助力企业级文档自动化。

# 人工智能 # 文字识别 # 并行计算 # 安全 # 异构计算

bug菌

|

6天前

|

博文

从“看见”到“预见”：合合信息“多模态文本智能技术”如何引爆AI下一场革命。

近期，在第八届中国模式识别与计算机视觉学术会议（PRCV 2025）上，合合信息作为承办方举办了“多模态文本智能大模型前沿技术与应用”论坛，汇聚了学术界的顶尖智慧，更抛出了一颗重磅“炸弹”——“多模态文本智能技术”概念。

# 人工智能 # 文字识别 # 自然语言处理 # 算法 # 计算机视觉

modelscope

|

6天前

|

博文

|

来自： ModelScope模型即服务

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Qwen3-VL家族重磅推出2B与32B双版本，轻量高效与超强推理兼备，一模型通吃多模态与纯文本任务！

# 文字识别 # 测试技术 # 开发者

深圳快瞳科技有限公司

|

6天前

|

博文

|

来自：阿里云百炼

医疗票据OCR技术演进：从模板匹配到智能理解的突破

医疗票据OCR正从传统模板匹配迈向智能理解新阶段。快瞳科技融合OCR与医疗知识图谱，实现高精度、自适应识别，显著提升效率与准确性，推动医疗数字化智能化升级。

# 大模型服务平台百炼 # 人工智能 # 文字识别 # API # 知识图谱 # 计算机视觉

架构师李哲

|

7天前

|

博文

|

来自：大数据与机器学习

引爆硅谷！DeepSeek开源谷歌“核心机密”？2025秋季开源视觉AI模型重磅盘点

DeepSeek-OCR震撼开源，以3B小模型高效压缩视觉文本，低成本处理长文档，被誉为“AI的JPEG时刻”。本文盘点五大热门视觉大模型：DeepSeek-OCR、Qwen3-VL、GLM-4.5V、SAIL-VL2、DINOv3，涵盖OCR、多模态理解、视觉特征提取等方向，从优缺点、适用场景到微调建议全面解读，助力开发者把握“预训练+微调”黄金窗口，快速落地视觉应用。

# 人工智能 # 文字识别 # 自然语言处理 # 开发者 # 计算机视觉

深圳快瞳科技有限公司

|

7天前

|

博文

|

来自：阿里云百炼

医疗票据OCR图像预处理：印章干扰过滤方案与代码实现

医疗票据OCR技术能自动提取票据中的关键信息，但在实际应用中面临多重挑战。首先，票据版式多样，不同医院、地区的格式差异大，需借助动态模板匹配技术来应对。其次，图像质量参差不齐，存在褶皱、模糊、倾斜、印章遮挡等问题，常通过超分辨率重建和图像修复算法处理。此外，手写体识别、复杂业务逻辑理解（如医疗术语和费用规则）以及数据安全与隐私合规要求也是技术难点。为应对这些挑战，快瞳系统采用“OCR基础识别 + NLP语义修正”的混合架构，并结合深度学习模型（如CRNN、Transformer）来提升准确率和泛化能力。该技术能显著提升医保报销、保险理赔等场景的效率，是推动医疗信息数字化管理的重要工具。

# 大模型服务平台百炼 # 机器学习/深度学习 # 编解码 # 文字识别 # 自然语言处理 # 算法

2025「AI安全」全球攻防赛小编

|

9天前

|

博文

阿里云神秘团队曝光：AI时代的新蓝军

天天和大模型“斗法”

# 人工智能 # 文字识别 # 监控 # 安全 # 算法

AI研究者手札

|

10天前

|

博文

中药材图像识别数据集（100类，9200张）｜适用于YOLO系列深度学习分类检测任务

本数据集包含9200张中药材图像，覆盖100种常见品类，已标注并划分为训练集与验证集，支持YOLO等深度学习模型。适用于中药分类、目标检测、AI辅助识别及教学应用，助力中医药智能化发展。

# 机器学习/深度学习 # 人工智能 # 文字识别 # 算法框架/工具 # 计算机视觉

dt_7992973394!

|

13天前

|

博文

|

来自：通义大模型

精通RAG：从“能用”到“好用”的进阶优化与评估之道

你的RAG应用是否总是答非所问，或者检索到的内容质量不高？本文聚焦于RAG系统的进阶优化，深入探讨从查询转换、多路召回与重排序（Rerank）等高级检索策略，到知识库构建的最佳实践。更重要的是，我们将引入强大的`Ragas`评估框架，教你如何用数据驱动的方式，科学地量化和提升你的RAG系统性能。

# 大模型服务平台百炼 # 数据采集 # 文字识别 # 算法 # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别