图像识别的搜索结果_热门_第12页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Zerox：AI驱动的万能OCR工具，精准识别复杂布局并输出Markdown格式，支持PDF、DOCX、图片等多种文件格式

Zerox 是一款开源的本地化高精度OCR工具，基于GPT-4o-mini模型，支持PDF、DOCX、图片等多种格式文件，能够零样本识别复杂布局文档，输出Markdown格式结果。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 文字识别 # API # 开发者

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Ola：清华联合腾讯等推出的全模态语言模型！实现对文本、图像、视频和音频的全面理解

Ola 是由清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型，支持文本、图像、视频和音频输入，并具备实时流式解码功能。

# 图像识别 # 人工智能 # 测试技术

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

PDF to Podcast：英伟达开源黑科技！PDF 秒转播客/有声书，告别阅读疲劳轻松学习！

NVIDIA推出的PDF to Podcast工具，基于大型语言模型和文本到语音技术，将PDF文档转换为生动的音频内容。

# 图像识别 # 存储 # 人工智能 # API # 语音技术 # 微服务

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

结合DeepSeek-R1强化学习方法的视觉模型！VLM-R1：输入描述就能精确定位图像目标

VLM-R1 是基于强化学习技术的视觉语言模型，通过自然语言指令精确定位图像目标，支持复杂场景推理与高效训练。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 决策智能 # 开发者

技术小达人

|

博文

达摩院工业视觉AI：“见微”生态认证与培训计划

本篇内容分享了达摩院工业视觉AI：“见微”生态认证与培训计划。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 达摩院 # 供应链 # 算法 # 计算机视觉

Lingxw_w

|

博文

【数据挖掘实战】——基于水色图像的水质评价(LM神经网络和决策树)

项目地址：Datamining_project: 数据挖掘实战项目代码

# 图像识别 # 机器学习/深度学习 # 数据采集 # 监控 # 数据挖掘 # 计算机视觉 # Python # 容器

锡兰Ceylan_

|

博文

|

来自：视觉智能

【OpenCv • c++】图像识别边缘检测图像差分运算

# 图像识别 # 视觉智能开放平台 # 计算机视觉 # C++

爱学习的千影

|

博文

图像识别：Python 与计算机视觉

在当今的数字时代，图像识别技术已经成为了许多领域的重要组成部分，包括计算机视觉、人工智能和机器学习等。Python 作为一种强大的编程语言，提供了丰富的工具和库，使开发者能够轻松地进行图像识别任务。在本文中，我们将探讨图像识别技术的基本原理，介绍一些常用的 Python 库，并通过一个简单的示例来展示如何使用这些库进行图像识别。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 算法 # 计算机视觉 # Python

AI小怪兽

|

博文

|

来自： ModelScope模型即服务

一种基于YOLOv8改进的高精度表面缺陷检测网络， NEU-DET和GC10-DET涨点明显（原创自研）

【7月更文挑战第3天】一种基于YOLOv8改进的高精度表面缺陷检测，在NEU-DET和GC10-DET任务中涨点明显；

# 图像识别 # 机器学习/深度学习 # 编解码 # 人工智能 # 文字识别 # 计算机视觉

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

OmniSearch：阿里巴巴通义推出的多模态检索增强生成框架

本文介绍了阿里巴巴通义实验室推出的多模态检索增强生成框架 OmniSearch，该框架具备自适应规划能力，能够动态拆解复杂问题，根据检索结果和问题情境调整检索策略，从而提升检索效率和准确性。

# 图像识别 # 人工智能 # API

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别