图像识别的搜索结果_文章_第4页-阿里云开发者社区

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Qwen2.5-VL-32B：阿里开源多模态核弹！32B模型吊打自家72B，数学推理封神

阿里巴巴最新开源的Qwen2.5-VL-32B多模态模型，在数学推理、视觉问答等任务中超越前代72B版本，支持图像细粒度理解和复杂逻辑分析，已在HuggingFace开源。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 决策智能 # 计算机视觉

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

StarVector：图像秒变矢量代码！开源多模态模型让SVG生成告别手绘

StarVector是由ServiceNow Research等机构联合开发的开源多模态视觉语言模型，能够将图像和文本转换为可编辑的SVG矢量图形，支持1B和8B两种规模，在SVG生成任务中表现出色。

# 图像识别 # 人工智能 # 自然语言处理 # 计算机视觉

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Second Me：硅基生命或成现实？如何用AI克隆自己，打造你的AI数字身份！

Second Me 是一个开源AI身份系统，允许用户创建完全私有的个性化AI代理，代表用户的真实自我，支持本地训练和部署，保护用户隐私和数据安全。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 搜索推荐 # 算法 # 数据安全/隐私保护

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

SpatialLM：手机视频秒建3D场景！开源空间认知模型颠覆机器人训练

SpatialLM 是群核科技开源的空间理解多模态模型，能够通过普通手机拍摄的视频重建 3D 场景布局，赋予机器人类似人类的空间认知能力，适用于具身智能训练、自动导航、AR/VR 等领域。

# 图像识别 # 数据采集 # 人工智能 # 数据可视化 # 机器人 # vr&ar

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Dify-Plus：企业级AI管理核弹！开源方案吊打SaaS，额度+密钥+鉴权系统全面集成

Dify-Plus 是基于 Dify 二次开发的企业级增强版项目，新增用户额度、密钥管理、Web 登录鉴权等功能，优化权限管理，适合企业场景使用。

# 图像识别 # 人工智能 # BI # API # 数据安全/隐私保护 # 容器

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

SmolDocling：256M多模态小模型秒转文档！开源OCR效率提升10倍

SmolDocling 是一款轻量级的多模态文档处理模型，能够将图像文档高效转换为结构化文本，支持文本、公式、图表等多种元素识别，适用于学术论文、技术报告等多类型文档。

# 图像识别 # 人工智能 # 文字识别 # 异构计算

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Mistral Small 3.1：240亿参数多模态黑马！128k长文本+图像分析，推理速度150token/秒

Mistral Small 3.1 是 Mistral AI 开源的多模态人工智能模型，具备 240 亿参数，支持文本和图像处理，推理速度快，适合多种应用场景。

# 图像识别 # 人工智能 # 缓存 # Apache # 计算机视觉 # 开发者

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

OpenBioMed：开源生物医学AI革命！20+工具链破解药物研发「死亡谷」

OpenBioMed 是清华大学智能产业研究院（AIR）和水木分子共同推出的开源平台，专注于 AI 驱动的生物医学研究，提供多模态数据处理、丰富的预训练模型和多样化的计算工具，助力药物研发、精准医疗和多模态理解。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 数据处理 # API # 容器

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Hunyuan3D 2.0：腾讯混元开源3D生成大模型！图生/文生秒建高精度模型，细节纹理自动合成

Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统，专注于从文本和图像生成高分辨率的 3D 模型，支持几何生成和纹理合成。

# 图像识别 # 人工智能 # PyTorch # API # 算法框架/工具 # 图形学

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

昆仑万维开源 Skywork R1V：开源多模态推理核弹！视觉链式分析超越人类专家

Skywork R1V 是昆仑万维开源的多模态思维链推理模型，具备强大的视觉链式推理能力，能够在多个权威基准测试中取得领先成绩，推动多模态推理模型的发展。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 测试技术 # 数据安全/隐私保护

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别