文字识别

首页 标签 文字识别
# 文字识别 #
关注
5906内容
t_img - 图片翻译接口接口对接全攻略:从入门到精通
t_img是图片翻译专用接口,支持OCR识别与翻译一体化处理,覆盖200+语言,兼容JPG/PNG/GIF等主流格式,保持原图排版,并支持批量处理、自动增强与多服务切换,实现“所见即所得”的高效翻译体验。(239字)
|
19天前
|
你的Clawdbot还是“废物”?因为缺了这套隐形外挂!
OpenClaw(原Clawdbot)亟需突破信息孤岛。数眼智能为其量身打造五大API:网页阅读+联网搜索让AI“看见”实时世界;OCR解析赋能文档理解;天气MCP等标准化接口接入垂直能力——秒级响应、高精度结构化输出,助智能体真正落地现实任务。(239字)
百度文心开源0.9B参数 PaddleOCR-VL-1.5,全球首个支持异形框定位的文档解析模型!
百度文心开源新一代文档解析模型PaddleOCR-VL-1.5:仅0.9B参数,在OmniDocBench v1.5达94.5%精度,全球首个支持异形框定位,精准识别倾斜、弯折、反光等“歪文档”,集成印章识别、多语种(含藏语/孟加拉语)及古籍解析能力,推理速度超MinerU2.5达43%。(239字)
目前最火的 AI 助手 Clawdbot 又又又改名了 并且发布新版本
OpenClaw(原Clawdbot/Moltbot)是火爆开源AI助手,支持飞书、WhatsApp、Telegram等20+平台,数据全本地、可调OCR/数据库/Shell命令。新版本新增Twitch等渠道、KIMI等模型及图片交互,安全强化升级。GitHub星标超10万!
|
24天前
|
RAGFlow实测:为什么理解文档比升级模型更能提升RAG可信度上限?
RAGFlow 是一款基于深度文档理解(Deep Document Understanding)的开源 RAG 引擎,核心优势在于利用 OCR 和布局识别技术精准解析多栏文本、复杂表格等高难度文档。通过模板化分块与可视化干预机制,它解决了企业知识库构建中解析质量差、检索精度低的痛点,是打造高质量企业级 AI 知识服务的理想方案。
|
27天前
| |
来自: 云原生
给显卡按下“暂停键”:阿里云函数计算 GPU “浅休眠”背后的硬核技术
AGI爆发时代,AI开发者困于“性能与成本不可兼得”:预留GPU成本高,按量启动延迟长。阿里云函数计算推出CPU/GPU实例浅休眠技术——显存状态迁移+驱动层无感兼容+请求级自动调度,实现毫秒唤醒、成本直降70%,让Serverless AI真正按需付费。
|
27天前
| |
来自: 云原生
给显卡按下“暂停键”:阿里云函数计算 GPU “浅休眠”背后的硬核技术
阿里云函数计算推出 CPU/GPU 实例浅休眠功能,通过 CPU 冻结、显存状态迁移、驱动层兼容和自动调度技术,实现毫秒级唤醒、闲置成本降低 70%。无需改代码,即可兼顾高效响应与极致降本,开启 Serverless AI 新范式。
|
28天前
| |
来自: 物联网
基于 Python 的反爬虫策略突破与逆向技巧总结
本文介绍四大常见反爬策略及Python应对方案:User-Agent伪装、代理IP绕过IP限制、Tesseract识别验证码、Selenium模拟浏览器获取动态数据,助你合法、高效采集网页信息。
10B击败200B!阶跃星辰10B视觉语言SOTA模型开源
阶跃星辰发布开源多模态小模型Step3-VL-10B,仅10B参数却媲美百亿级大模型,在视觉感知、逻辑推理、数学竞赛等任务中达同规模SOTA,支持端侧部署,推动智能终端交互革新。
让大模型“读懂”你的文档:RAG核心技术——文档切分完全指南
文档切分是智能问答系统成败的关键。本文深入解析RAG技术中分块(Chunking)的核心原理,涵盖五大切分策略:从基础的按句子、固定长度切分,到更智能的递归与语义切分。通过LangChain实战代码,手把手教你处理文本、Markdown、代码等多格式文档,并优化块大小、重叠与分隔符参数。提供人工抽样、模拟检索和端到端测试三大评估方法,助你构建高效精准的知识检索体系。
免费试用