文字识别的搜索结果_热门_第13页-阿里云开发者社区

小小鹿鹿鹿

|

问答

|

来自：视觉智能

文字识别ocr支持android吗，android sdk文档链接有不？

# 文字识别 # 视觉智能开放平台 # Android开发 # 文字识别 # 开发工具

modelscope

|

博文

|

来自： ModelScope模型即服务

统一多模态Embedding, 通义实验室开源GME系列模型

随着多媒体应用的迅猛发展，用户产生的数据类型日益多样化，不再局限于文本，还包含大量图像、音频和视频等多模态信息。这为信息检索带来了前所未有的挑战与机遇。传统的信息检索模型多关注单一模态，如仅对文本或图像进行分析和搜索。

# 文字识别

游客ut6x3zl4kcddi

|

2月前

|

博文

【新手入门级操作open claw】新手入门 OpenClaw 2.6.2 技能选择推荐

OpenClaw 2.6.2（小龙虾）是一款AI驱动的电脑自动化工具，内置5大类实用Skill技能：文件管理、办公自动化、浏览器操作、系统管理与内容处理。支持自然语言指令，如“整理桌面”“生成周报”“抓取网页数据”，零代码上手。新手推荐启用5项核心技能，一键提升办公效率。

# 人工智能 # 自然语言处理 # 文字识别 # 安全 # BI

xql7g6wrhghw6

|

博文

Visionpro从小白到大佬，第一章了解工具名称和用途

# 机器学习/深度学习 # 文字识别 # 数据挖掘 # API # C# # 计算机视觉

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

moonshot-v1-vision-preview：月之暗面Kimi推出多模态视觉理解模型，支持图像识别、OCR文字识别、数据提取

moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型，具备强大的图像识别、OCR文字识别和数据提取能力，支持API调用，适用于多种应用场景。

# 文字识别 # 图像识别 # 人工智能 # 文字识别 # API # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Stirling-PDF：51.4K Star！用Docker部署私有PDF工作站，支持50多种PDF操作，从此告别在线工具

Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具，支持 50 多种 PDF 操作，包括合并、拆分、转换、压缩等，同时提供多语言支持和企业级功能，满足个人和企业用户的多样化需求。

# 自然语言处理 # 人工智能 # 文字识别 # 安全 # Docker # 容器

老乡别走

|

博文

|

来自：视觉智能

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

在生活和工作中，我们常需处理大量PDF文件，如银行单据、税收单据等。手动处理效率低下，而使用“咕嘎批量PDF多区域内容提取重命名导表格系统”可快速完成数千份文档的处理，大幅提高效率。该工具通过获取PDF各区域内容坐标，导入并处理文件，最终将信息提取至表格，并根据关键信息对PDF进行重命名，方便管理和查找。

# 视觉智能开放平台 # 文字识别

灵杰开发者

|

博文

|

来自：大数据与机器学习

企业级AI搜索解决方案：阿里云AI搜索开放平台

本文介绍了阿里云 AI 搜索开放平台作提供丰富的 AI 搜索组件化服务，兼容主流开发框架 LangChain和 LlamaIndex，支持搜索专属大模型、百炼等大模型服务，以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务，实现智能搜索、检索增强生成（RAG）、多模态搜索等场景的搭建。

# 人工智能 # 开发框架 # 自然语言处理 # 文字识别 # 搜索推荐

云小帮

|

3月前

|

博文

阿里云Tokens如何收费？免费千万Tokens领取及亿万AI大模型扶持计划申请入口

阿里云Tokens按输入/输出分别计费，价格因模型而异（如Qwen-Turbo：0.0003/0.0006元/千Tokens）。新用户开通百炼平台可免费领7000万Tokens（各模型享100万额度），企业认证还可申领万亿Tokens扶持及2000元券，免费Tokens申请链接：https://t.aliyun.com/U/fPVHqY

# 人工智能 # 文字识别 # 内存技术

站大爷

|

9天前

|

博文

避开“过度自动化”：哪些办公流程根本不适合交给Agent？

本文揭示办公自动化常见误区，指出四类绝不该全自动的场景：后果不可逆、需情感判断、规则频繁变更、输入极度不规范。强调“半自动”才是最优解——Agent做执行，人掌决策权。（239字）

# 人工智能 # 自然语言处理 # 文字识别

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别