图像识别的搜索结果_文章_第4页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Cosmos-Reason1：物理常识觉醒！NVIDIA 56B模型让AI懂重力+时空法则

Cosmos-Reason1是NVIDIA推出的多模态大语言模型系列，具备物理常识理解和具身推理能力，支持视频输入和长链思考，可应用于机器人、自动驾驶等场景。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 自动驾驶 # 机器人

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Mureka V6：10语种AI音乐工厂！昆仑万维「声场黑科技」颠覆作曲

昆仑万维推出的Mureka V6 AI音乐创作基座模型，支持10种语言歌词生成和纯音乐创作，通过自研ICL技术实现声场优化，覆盖爵士/电子/流行等多元风格，为音乐爱好者和专业创作者提供高效工具。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 数据库 # 决策智能 # Swift

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Qwen2.5-VL-32B：阿里开源多模态核弹！32B模型吊打自家72B，数学推理封神

阿里巴巴最新开源的Qwen2.5-VL-32B多模态模型，在数学推理、视觉问答等任务中超越前代72B版本，支持图像细粒度理解和复杂逻辑分析，已在HuggingFace开源。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 决策智能 # 计算机视觉

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

StarVector：图像秒变矢量代码！开源多模态模型让SVG生成告别手绘

StarVector是由ServiceNow Research等机构联合开发的开源多模态视觉语言模型，能够将图像和文本转换为可编辑的SVG矢量图形，支持1B和8B两种规模，在SVG生成任务中表现出色。

# 图像识别 # 人工智能 # 自然语言处理 # 计算机视觉

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Second Me：硅基生命或成现实？如何用AI克隆自己，打造你的AI数字身份！

Second Me 是一个开源AI身份系统，允许用户创建完全私有的个性化AI代理，代表用户的真实自我，支持本地训练和部署，保护用户隐私和数据安全。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 搜索推荐 # 算法 # 数据安全/隐私保护

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

SpatialLM：手机视频秒建3D场景！开源空间认知模型颠覆机器人训练

SpatialLM 是群核科技开源的空间理解多模态模型，能够通过普通手机拍摄的视频重建 3D 场景布局，赋予机器人类似人类的空间认知能力，适用于具身智能训练、自动导航、AR/VR 等领域。

# 图像识别 # 数据采集 # 人工智能 # 数据可视化 # 机器人 # vr&ar

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Dify-Plus：企业级AI管理核弹！开源方案吊打SaaS，额度+密钥+鉴权系统全面集成

Dify-Plus 是基于 Dify 二次开发的企业级增强版项目，新增用户额度、密钥管理、Web 登录鉴权等功能，优化权限管理，适合企业场景使用。

# 图像识别 # 人工智能 # BI # API # 数据安全/隐私保护 # 容器

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

SmolDocling：256M多模态小模型秒转文档！开源OCR效率提升10倍

SmolDocling 是一款轻量级的多模态文档处理模型，能够将图像文档高效转换为结构化文本，支持文本、公式、图表等多种元素识别，适用于学术论文、技术报告等多类型文档。

# 图像识别 # 人工智能 # 文字识别 # 异构计算

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Mistral Small 3.1：240亿参数多模态黑马！128k长文本+图像分析，推理速度150token/秒

Mistral Small 3.1 是 Mistral AI 开源的多模态人工智能模型，具备 240 亿参数，支持文本和图像处理，推理速度快，适合多种应用场景。

# 图像识别 # 人工智能 # 缓存 # Apache # 计算机视觉 # 开发者

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

OpenBioMed：开源生物医学AI革命！20+工具链破解药物研发「死亡谷」

OpenBioMed 是清华大学智能产业研究院（AIR）和水木分子共同推出的开源平台，专注于 AI 驱动的生物医学研究，提供多模态数据处理、丰富的预训练模型和多样化的计算工具，助力药物研发、精准医疗和多模态理解。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 数据处理 # API # 容器

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别