文字识别的搜索结果_第4页-阿里云开发者社区

javaercn

|

17天前

|

博文

|

10 分钟上手 Stirling PDF：阿里云 ECS Docker 部署 PDF 工具箱

Stirling PDF 是一款开源、可本地部署的 Web PDF 工具箱，支持合并、拆分、压缩、加水印、文本编辑等60+功能。文件仅在内存中临时处理，自动清理，安全私有。本文详解10分钟 Docker 部署（Ubuntu 24.04 实测），含 ultra-lite 镜像快速启动、中文配置与实操验证。

# 文字识别 # Java # 数据安全/隐私保护 # Docker # 容器

呼噜噜来了

|

18天前

|

博文

2026 智能自动化演进：从规则 RPA 到大模型 Agent RPA 完整路线

2026年，RPA正加速进化为“AI Agent”：大模型负责理解与决策，RPA专注执行与操作，实现自主修复、跨系统协同与自然语言驱动。IDC预测中国RPA+AI市场规模将超70亿元，超自动化成企业数字化刚需。本文详解五大落地场景、三大技术趋势及四大避坑指南，助开发者高效构建安全、稳定、可交付的智能自动化方案。

# 人工智能 # 文字识别 # 自然语言处理 # API # 开发者

问号云

|

20天前

|

博文

|

来自：弹性计算

阿里云Qwen 3.7 Plus与Max实测对比：2026年多模态能力与性价比深度解析

2026年阿里云推出的Qwen 3.7系列包含Plus与Max两款核心模型，二者共享100万tokens超长上下文窗口与35小时自治执行上限，但在模态能力、底层架构、输出上限与资费标准上存在本质差异，分别面向不同量级与类型的AI应用场景。

# 人工智能 # 自然语言处理 # 文字识别 # 数据挖掘 # 计算机视觉

游客ul4n4qhqvhsfe

|

21天前

|

博文

|

来自： ModelScope模型即服务

Deepseek大语言模型在多语种手稿数字化中的工程实践与策略

大量前人留下的手稿，是现代图片文字识别（OCR）的终极考验。目前的工具，均无法达成可接受的文本识别水准。以钱钟书多语种手写笔记为例，包含了多达8种西方语言的广泛题材文本摘录，因文字种类繁多、笔迹复杂、多有插入与标记等，版式多变而长期难以实现数字化。本项目利用 DeepSeek v4大语言模型、结合 Playwright 浏览器自动化技术，构建一套高成功率、低技术门槛的半自动化文本提取流水线的完整实践。通过分阶段的多轮策略优化——从全自动脚本到人在环中的半自动模式，再结合识图模式的精准分流与定期重启机制，解决了“无视觉API”与“上下文污染”两大瓶颈，实现了多种语言手稿的”可计算“文本转化。

# 人工智能 # 缓存 # 文字识别 # API # Python

风骏少年

|

24天前

|

博文

AI办公高频问题汇总梳理清单

本文汇总AI办公四大场景（对话、文档解析、表格处理、图文生成）高频问题，配套轻量Python工具实现问题自动录入、分类统计与Excel导出，仅需pandas、json库，跨平台免配置，助力行政、运维与技术人员快速排障提效。（239字）

# 数据采集 # 人工智能 # 运维 # 文字识别 # Python

呼噜噜来了

|

24天前

|

博文

内网环境跑通RPA自动化：企业级私有化部署实战

政企客户因数据安全与合规要求（如等保三级、涉密保护），必须采用内网离线RPA：避免敏感数据外泄、保障业务连续性、满足审计要求。本文详解纯内网单机、内网集群、混合云三种私有化部署架构，离线授权机制、安全加固要点及典型踩坑案例，助力政务、金融、军工等行业安全落地RPA。（239字）

# 存储 # 人工智能 # 文字识别 # API # 数据安全/隐私保护

小鲸云

|

24天前

|

博文

|

来自：阿里云百炼

阿里云Qwen 3.7 Plus与Max全解析：资费、消耗、配置与多模态能力深度对比

阿里云Qwen 3.7系列包含Plus与Max两款核心模型，共享100万Tokens超长上下文窗口与35小时自治执行上限，但在模态能力、底层架构、输出上限与资费标准上存在本质差异，分别面向不同量级与类型的AI应用场景。

# 大模型服务平台百炼 # 缓存 # 人工智能 # 文字识别 # 自然语言处理 # 开发者

芦熙霖

|

25天前

|

博文

纸质单据结合二维码的混合式钓鱼攻击研究与防御

本文以2026年瑞士邮政仿冒取件单二维码钓鱼事件为案例，系统剖析纸质单据+二维码混合式钓鱼的全链路攻击机制，揭示其利用民众对实体单据信任的社会工程学本质；原创开发三类Python自动化检测工具，并构建覆盖民众、企业、监管的四维防御体系，为防范跨境复合型诈骗提供技术支撑与实践范式。（239字）

# 文字识别 # 安全 # 前端开发 # 网络安全 # Python

游客yiesg6gvg7ieg

|

26天前

|

博文

PDF复杂表格的1:1还原引擎：跨页表格自动拼接技术实战

企业AI应用中PDF表格解析难题及JBoltAI的1:1还原技术解决方案。

# 存储 # 人工智能 # 文字识别 # 算法 # 开发工具

北京木奇移动技术

|

29天前

|

博文

企业落地AI知识库的费用

AI企业知识库开发费用无统一标准，主要取决于方案选择（SaaS低代码/开源定制/全私有化）、数据规模、安全要求与业务复杂度。费用涵盖一次性研发（3万–15万+）、持续算力（Token/向量服务）及数据处理成本。建议先MVP验证，理性评估私有化必要性。（239字）

# 存储 # 人工智能 # 文字识别 # 前端开发 # API

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别