文字识别的搜索结果_热门_第20页-阿里云开发者社区

游客3g2isv2zt6tuw

|

4月前

|

博文

自动识别图片点击脚本，文字识别自动点击器，能识别屏幕内容并自动点击

本方案采用OCR文字识别+图像匹配双模式识别技术： OCR引擎识别屏幕文字内容 OpenCV模板匹配识别图形元素 PyAutoGUI实现

# 文字识别 # JSON # 文字识别 # 并行计算 # 计算机视觉 # Python

3ewaj2jnqceye

|

博文

秒懂全文：盘点13个各具特色的AI智能阅读助手工具

在当今信息爆炸的时代，AI阅读工具正在革新我们的阅读方式，成为了提高效率、优化阅读体验的关键。这类AI阅读辅助工具，只需要上传文件或者输入链接，便可以直接以聊天对话的形式进行一键总结和智能问答，满足用户AI PDF 阅读、AI文档问答分析、AI音视频总结等多种实用需求，高效提炼信息要点精华，建立属于自己的AI知识管理和信息管理工作流。对此，根据阅读场景，精选了 13 个具有代表性、各具特点的高质量 AI 阅读助手助理。具体如何选择，见文末总结。

# 人工智能 # 自然语言处理 # 文字识别 # 安全 # iOS开发

小华同学ai

|

9月前

|

博文

Uppy：告别传统上传！这款开源工具如何让文件传输效率提升300%？🐶

**Uppy** 是由 Transloadit 团队开发的模块化、高扩展性的 JavaScript 文件上传库，支持断点续传、云存储直传、图片编辑等高级功能。它无缝集成 React、Vue 等框架，兼容移动端，被 Instagram、知乎等企业采用。Uppy 采用“核心+插件”架构，代码轻量且功能强大，适合电商、在线教育等多种场景。项目开源免费，GitHub 获得数万星标，提供丰富的插件生态和跨平台支持。

# 存储 # 文字识别 # JavaScript # 前端开发 # 开发者

老乡别走

|

9月前

|

博文

|

来自：视觉智能

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

在生活和工作中，我们常需处理大量PDF文件，如银行单据、税收单据等。手动处理效率低下，而使用“咕嘎批量PDF多区域内容提取重命名导表格系统”可快速完成数千份文档的处理，大幅提高效率。该工具通过获取PDF各区域内容坐标，导入并处理文件，最终将信息提取至表格，并根据关键信息对PDF进行重命名，方便管理和查找。

# 视觉智能开放平台 # 文字识别

bailiantest1

|

28天前

|

博文

|

来自：通义大模型

同时斩获两个开源第一，超火的通义Qwen3-VL CookBook来了

Qwen3-VL开源发布后广受认可，登顶Chatbot Arena视觉榜与OpenRouter图像处理市场份额第一。支持文档解析、OCR、视频理解、3D定位等多模态任务，现推出详细Cookbook助力开发者高效应用。

# 大模型服务平台百炼 # 文字识别 # 自然语言处理 # API # 开发者 # 计算机视觉

3ewaj2jnqceye

|

博文

云笔记横向评测:印象笔记、有道云笔记、为知笔记、OneNote、Notion、FlowUs、Wolai、飞书、语雀

某款软件是否好用，既需要根据其功能特性评估其优点和缺点，也需要分析用户的基本需求。以下是常见云笔记的深度评测。云笔记评测标准：分析每款笔记软件的核心特色、优点、缺点及使用场景。具体包括：印象笔记、有道云笔记、为知笔记、OneNote、Notion、FlowUs、Wolai、飞书、语雀

# Web App开发 # 存储 # 文字识别 # 数据可视化 # 搜索推荐 # 安全 # 项目管理 # Android开发 # iOS开发 # 开发者

游客ib7xsk7hcucuo

|

5月前

|

博文

闲鱼秒拍脚本插件工具，闲鱼自动捡漏低价软件，监控最新发布商品

这是一款名为“星辰闲鱼扫货【支持下单】v2.1”的自动化脚本工具，可实现闲鱼低价商品的监控与自动操作。用户可通过设置最高价

# XML # 文字识别 # 监控 # 数据格式

小凡晓宇

|

博文

autojs免费版4.1.1合并EasyEdge, 实现离线OCR

牙叔教程简单易学

# 文字识别 # 文字识别 # JavaScript # Go # Android开发 # 计算机视觉

颜淡慕潇

|

博文

探索古彝文AI识别技术：助力中国传统文化的传承与发扬

随着科技的不断发展，OCR（Optical Character Recognition，光学字符识别）技术在各个领域得到了广泛应用。近年来，古彝文作为一种具有悠久历史和独特魅力的文字，逐渐受到了学者们的关注。探索古彝文识别OCR技术，不仅有助于挖掘、整理和传承中国传统文化，还能为现代科技与文化的交流搭建桥梁。

# 文字识别 # 人工智能 # 文字识别 # 自然语言处理 # 数据库 # 计算机视觉

blackswan_xdu-25928

|

11月前

|

博文

|

来自：通义大模型

Qwen2-VL微调实战：LaTex公式OCR识别任务（完整代码）

《SwanLab机器学习实战教程》推出了一项基于Qwen2-VL大语言模型的LaTeX OCR任务，通过指令微调实现多模态LLM的应用。本教程详述了环境配置、数据集准备、模型加载、SwanLab集成及微调训练等步骤，旨在帮助开发者轻松上手视觉大模型的微调实践。

# JSON # 文字识别 # 数据可视化 # 物联网 # 数据格式

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别