文字识别的搜索结果_文章_第2页-阿里云开发者社区

深圳快瞳科技有限公司

|

21天前

|

博文

|

医疗票据OCR技术能自动提取票据中的关键信息，但在实际应用中面临多重挑战。首先，票据版式多样，不同医院、地区的格式差异大，需借助动态模板匹配技术来应对。其次，图像质量参差不齐，存在褶皱、模糊、倾斜、印章遮挡等问题，常通过超分辨率重建和图像修复算法处理。此外，手写体识别、复杂业务逻辑理解（如医疗术语和费用规则）以及数据安全与隐私合规要求也是技术难点。为应对这些挑战，快瞳系统采用“OCR基础识别 + NLP语义修正”的混合架构，并结合深度学习模型（如CRNN、Transformer）来提升准确率和泛化能力。该技术能显著提升医保报销、保险理赔等场景的效率，是推动医疗信息数字化管理的重要工具。

# 大模型服务平台百炼 # 机器学习/深度学习 # 编解码 # 文字识别 # 自然语言处理 # 算法

2025「AI安全」全球攻防赛小编

|

23天前

|

博文

阿里云神秘团队曝光：AI时代的新蓝军

天天和大模型“斗法”

# 人工智能 # 文字识别 # 监控 # 安全 # 算法

AI研究者手札

|

24天前

|

博文

中药材图像识别数据集（100类，9200张）｜适用于YOLO系列深度学习分类检测任务

本数据集包含9200张中药材图像，覆盖100种常见品类，已标注并划分为训练集与验证集，支持YOLO等深度学习模型。适用于中药分类、目标检测、AI辅助识别及教学应用，助力中医药智能化发展。

# 机器学习/深度学习 # 人工智能 # 文字识别 # 算法框架/工具 # 计算机视觉

dt_7992973394!

|

27天前

|

博文

|

来自：通义大模型

精通RAG：从“能用”到“好用”的进阶优化与评估之道

你的RAG应用是否总是答非所问，或者检索到的内容质量不高？本文聚焦于RAG系统的进阶优化，深入探讨从查询转换、多路召回与重排序（Rerank）等高级检索策略，到知识库构建的最佳实践。更重要的是，我们将引入强大的`Ragas`评估框架，教你如何用数据驱动的方式，科学地量化和提升你的RAG系统性能。

# 大模型服务平台百炼 # 数据采集 # 文字识别 # 算法 # 索引

游客hp4x2qkhydglu

|

27天前

|

博文

拔俗AI产投档案管理系统：用技术打通产业投资的“信息任督二脉”

针对产业投资中档案分散、非结构化难题，AI产投档案管理系统通过智能OCR、行业NLP与知识图谱技术，实现档案自动解析、关联挖掘与语义检索，将“死文件”变为可分析的“活资产”，提升信息利用效率与投资决策支持能力。

# 人工智能 # 自然语言处理 # 文字识别 # 新能源 # 知识图谱

bailiantest1

|

28天前

|

博文

|

来自：通义大模型

同时斩获两个开源第一，超火的通义Qwen3-VL CookBook来了

Qwen3-VL开源发布后广受认可，登顶Chatbot Arena视觉榜与OpenRouter图像处理市场份额第一。支持文档解析、OCR、视频理解、3D定位等多模态任务，现推出详细Cookbook助力开发者高效应用。

# 大模型服务平台百炼 # 文字识别 # 自然语言处理 # API # 开发者 # 计算机视觉

游客ymbxnyimjzpdk

|

1月前

|

博文

2025年企业防范员工向第三方人工智能工具泄露数据的全面防护方案

随着生成式人工智能工具的普及，企业员工在日常工作中越来越依赖ChatGPT、DeepSeek等第三方AI服务提升效率。然而，这种便利背后隐藏着严重的数据泄露风险。调查显示，近六成企业发生过敏感数据提交事件，其中三成导致实际泄露。传统防护手段在面对AI数据泄露场景时效果有限，企业急需建立针对性的防护体系。

# 人工智能 # 文字识别 # 安全 # 算法 # 数据安全/隐私保护

技术员阿伟

|

1月前

|

博文

|

来自：阿里云百炼

《大模型驱动的智能文档解析系统：从领域适配到落地优化的全链路开发实践》

本文聚焦大模型在高端装备制造企业智能文档解析系统的落地实践，针对领域术语理解断层、长文档上下文限制、知识提取精准度不足、响应缓慢、微调成本高、稳定性差等核心痛点，提出对应解决方案：构建领域术语知识底座适配行业语境，以语义分块+关联图谱突破长文档解析瓶颈，用多轮校验+规则库保障知识可靠性，通过分层部署+多级缓存优化响应速度，采用增量微调+prompt工程降低成本并提升泛化能力，依托全链路监控+自动化运维保障长期稳定。优化后，术语识别准确率、知识逻辑完整性显著提升，单文档初步解析响应缩至3秒内，故障发生率降至1.2%，印证大模型落地需全链路协同且贴合领域需求。

# 大模型服务平台百炼 # 缓存 # 运维 # 文字识别 # 自然语言处理 # 异构计算

技术员阿伟

|

1月前

|

博文

《大模型赋能文化遗产数字化：古籍修复与知识挖掘的技术实践》

本文记录大模型赋能文化遗产数字化的实践，针对古籍异体字识别难、残缺文本补全不准、隐性知识难挖掘、多模态数据割裂、中小机构部署难、知识难更新等痛点，提出对应方案：搭建古籍文字与语境知识库提升识别理解率，以多源史料关联与历史逻辑约束实现文本精准补全，构建多层级框架挖掘隐性知识，设计多模态语义对齐整合多元信息，通过轻量化优化与混合部署降低使用门槛，建立动态机制保障知识迭代。优化后多项关键指标显著提升，为古籍数字化提供有效路径。

# 文字识别 # 自然语言处理 # 数据处理 # 数据库 # 知识图谱

啦啦啦191

|

1月前

|

博文

|

来自：数据库

Umi-OCR_文字识别工具免安装使用教程（附下载安装包）!永久免费，开源离线OCR识别软件下载

Umi-OCR是一款开源免费、支持离线运行的高精度OCR文字识别工具，基于深度学习技术，可快速识别中文、英文、日文等多种语言。无需联网，保护隐私，适用于Windows和Linux系统，解压即用，操作简便，是处理图片转文本的理想选择。

# 文字识别 # 机器学习/深度学习 # 文字识别 # Linux # Windows

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别