文字识别

首页 标签 文字识别
# 文字识别 #
关注
5992内容
出版社题库系统的开发
出版社题库系统将纸质教辅转化为结构化数字资产,支持多模态题型、智能组卷、三审三校及多端应用。涵盖编校入库、组卷引擎、师生端、版权运营四大模块,攻克公式识别、高并发等难点,赋能“一书一码”、B端授权与C端增值服务,助力教育出版数智化转型。(239字)
|
23天前
|
端侧AI在工业AR终端上的部署实践:模型轻量化与MNN推理优化
本文针对工业AR终端(八核/3GB/Android)离线AI部署难题,提出轻量化(知识蒸馏+INT8量化+通道剪枝)与推理优化(MNN引擎、流水线并行、内存复用)方案。实测三模型总大小仅12MB,端到端延迟178ms,内存占用降低70%,续航影响可控,已落地电力巡检与化工安全场景。(239字)
薅羊毛!5种方式免费下载百度文库
百度文库,应该可以称得上百度系为数不多良心产品之一。
看听说写四维突破:Qwen2.5-Omni 端到端多模态模型开源!
今天,通义千问团队发布了 Qwen2.5-Omni,Qwen 模型家族中新一代端到端多模态旗舰模型。该模型专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。
阿里云AI产品免费试用:超7000万大模型tokens免费体验,零成本构建AI应用
阿里云推出AI产品免费试用活动,提供30余款AI产品及7000万大模型tokens免费体验,涵盖百炼平台、PAI人工智能平台、GPU云服务器、自然语言处理、视觉智能等产品,用户可零成本构建AI应用。活动支持全能力AI Agent开发、一键部署大模型、灵活配置GPU卡型、智能构建文本应用及视觉AI应用,满足企业及开发者在模型开发、训练、推理及多场景适配中的需求,助力AI技术高效落地与业务创新。
2025年企业防范员工向第三方人工智能工具泄露数据的全面防护方案
随着生成式人工智能工具的普及,企业员工在日常工作中越来越依赖ChatGPT、DeepSeek等第三方AI服务提升效率。然而,这种便利背后隐藏着严重的数据泄露风险。调查显示,近六成企业发生过敏感数据提交事件,其中三成导致实际泄露。传统防护手段在面对AI数据泄露场景时效果有限,企业急需建立针对性的防护体系。
小白必看 OpenClaw 2.6.2 高频 Skill 技能使用教程
OpenClaw 2.6.2(小龙虾)重磅升级!推荐15个高实用性Skill技能,覆盖文件整理、办公自动化、浏览器操作、系统管理、内容处理五大场景。小白必开5大核心技能:文件自动分类、Office/WPS自动化、PDF全能处理、网页信息采集、系统状态检测与清理,指令一发,多任务并行完成,办公效率飙升!
|
5月前
|
RAGFlow实测:为什么理解文档比升级模型更能提升RAG可信度上限?
RAGFlow 是一款基于深度文档理解(Deep Document Understanding)的开源 RAG 引擎,核心优势在于利用 OCR 和布局识别技术精准解析多栏文本、复杂表格等高难度文档。通过模板化分块与可视化干预机制,它解决了企业知识库构建中解析质量差、检索精度低的痛点,是打造高质量企业级 AI 知识服务的理想方案。
【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名
学校和教育机构常需处理成绩单、报名表等PDF文件。通过OCR技术,可自动提取学生信息并录入Excel,便于统计分析和存档管理。本文介绍使用阿里云服务实现批量OCR识别、内容提取、重命名及导出表格的完整步骤,包括开通相关服务、编写代码、部署函数计算和设置自动化触发器等。提供Python示例代码和详细操作指南,帮助用户高效处理PDF文件。 链接: - 百度网盘:[链接](https://pan.baidu.com/s/1mWsg7mDZq2pZ8xdKzdn5Hg?pwd=8866) - 腾讯网盘:[链接](https://share.weiyun.com/a77jklXK)
免费试用