文字识别

首页 标签 文字识别
# 文字识别 #
关注
5920内容
|
10小时前
|
养活OpenClaw这只“大龙虾”的是人,是配置,是算力,不是它自己!
OpenClaw要想摆脱“翻车”困境,最终还是要回归技术本质,大模型下半场,与其说拼的是人还不如说是拼的工程化落地能力,而优质的算力底座,正是工程化落地的核心根基。
|
12小时前
|
文档变形记:用SpringBoot让Word和PDF“相亲相爱”的魔幻操作
Word转PDF就像一场浪漫的婚礼:Word穿上PDF的婚纱,承诺"从今以后,我的格式永不变心"。PDF转Word则像一场冒险:PDF尝试脱下严肃的外套,说"让我也试试自由的感觉"。
|
12小时前
| |
AI行业开卷智能体,看完这篇文章,让你快速了解智能体是如何构建的
2025年,企业智能体迈向“深度落地、端到端执行”新阶段。金智维提出“规划+执行”双引擎架构:Ki-AgentS负责认知规划,K-APA保障确定性执行,融合大模型与自动化能力,打造可信、可审计、可干预的AI数字员工,已在金融、政务、汽车等领域规模化落地。
|
3天前
| |
来自: 弹性计算
阿里云AI产品免费试用:7000万Tokens+30款产品零成本体验!
阿里云推出“AI免费试用”活动:新用户享7000万Tokens、100张图+50秒视频生成额度,覆盖通义千问Qwen3、万相2.6等30+款AI产品。零门槛开通即用,支持Agent搭建、代码生成、NLP/视觉智能等全场景实践,助开发者低成本启航AI应用开发。
|
5天前
|
警惕!这封邮件,其实是用代码“画”出来的陷阱
新型钓鱼邮件利用HTML表格“绘制”二维码或类汉字图形,绕过传统图像识别与关键词过滤,威胁邮件安全。本文剖析其技术原理,并介绍行为级渲染检测等纵深防御方案。(239字)
|
6天前
|
基于 YOLOv8 的面向文档智能处理的表格区域检测系统 [目标检测完整源码]
本项目基于YOLOv8构建文档表格区域检测系统,支持扫描件、电子文档等多源输入,具备高精度、强鲁棒性;集成PyQt5可视化界面,提供单图/批量/视频检测与结果导出功能,开箱即用。含完整源码、预训练模型及标注数据集,可无缝对接OCR与结构化解析,助力金融、政务、医疗等场景文档智能化。
|
6天前
|
OCRFix僵尸网络利用ClickFix技术的攻击机理
本文深度剖析新型无文件僵尸网络OCRFix,其利用“ClickFix”社会工程学技术,伪装OCR修复向导诱导用户手动执行恶意PowerShell命令,在内存中加载载荷、建立C2通信。文章解构攻击全链路,并提出融合认知教育、行为监控与应用白名单的综合防御策略。(239字)
AI英语学习APP的开发
2026年国产AI英语学习APP已升级为“生成式AI+具身智能+情感交互”新范式:融合国产大模型(DeepSeek/讯飞/通义)双端协同、音素级纠音、OCR实景学习、自适应知识图谱与AI外教Agent,并深度适配微信/HarmonyOS生态,全面通过国内AI备案与未成年保护合规要求。(239字)
小红书开源FireRed-OCR,2B 参数登顶文档解析榜单
小红书FireRed团队开源的FireRed-OCR(仅20亿参数),在OmniDocBench v1.5端到端评测中以92.94%综合得分登顶,超越Gemini 3.0 Pro等大模型。专注解决文档解析中的“结构幻觉”问题,通过三阶段训练+格式约束强化学习,精准还原表格、公式、多栏等复杂结构。Apache 2.0协议,ModelScope开源,支持本地商用部署。(239字)
|
9天前
| |
来自: 视觉智能
视频后期黑科技:深度拆解开源 VSR 架构与视频 Inpainting 实践全指南
本文深度解析视频补全(Video Inpainting)前沿技术,聚焦硬字幕去除工具VSR的底层架构(OCR定位、时序传播、光流对齐)、本地部署要点(CUDA环境、显存优化)及云端方案(550W AI扩散模型),对比二者在隐私、效率与画质上的差异,助力开发者科学选型。(239字)
免费试用