图像识别的搜索结果_文章_第6页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

PodAgent：港中文、微软、小红书联合推出的播客生成框架

PodAgent 是由香港中文大学、微软和小红书联合推出的播客生成框架，基于多智能体协作系统，自动生成高质量对话内容，支持声音角色匹配和语音合成，适用于媒体、教育、企业推广等多个场景。

# 图像识别 # 人工智能 # 自然语言处理 # 语音技术 # 决策智能

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

SpatialVLA：上海AI Lab联合上科大推出的空间具身通用操作模型

SpatialVLA 是由上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型，基于百万真实数据预训练，赋予机器人强大的3D空间理解能力，支持跨平台泛化控制。

# 图像识别 # 人工智能 # 机器人 # 物联网 # 异构计算

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

OmniAlign-V：20万高质量多模态数据集开源，让AI模型真正对齐人类偏好

OmniAlign-V 是由上海交通大学、上海AI Lab等机构联合推出的高质量多模态数据集，旨在提升多模态大语言模型与人类偏好的对齐能力。该数据集包含约20万个多模态训练样本，涵盖自然图像和信息图表，结合开放式问答对，支持知识问答、推理任务和创造性任务。

# 图像识别 # 数据采集 # 人工智能 # 文字识别 # 测试技术

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

NotaGen：中央音乐学院联合清华推出AI音乐生成模型，古典乐谱一键生成，音乐性接近人类！

NotaGen 是由中央音乐学院、北京航空航天大学、清华大学等机构联合推出的音乐生成模型，基于模仿大型语言模型的训练范式，能够生成高质量的古典乐谱。该模型通过预训练、微调和强化学习相结合的方式，显著提升了符号音乐生成的艺术性和可控性。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 并行计算 # 算法 # PyTorch

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Probly：开源 AI Excel表格工具，交互式生成数据分析结果与可视化图表

Probly 是一款结合电子表格功能与 Python 数据分析能力的 AI 工具，支持在浏览器中运行 Python 代码，提供交互式电子表格、数据可视化和智能分析建议，适合需要强大数据分析功能又希望操作简便的用户。

# 图像识别 # 人工智能 # 数据可视化 # 前端开发 # 数据挖掘 # Python

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

CogView4：智谱开源中文文生图新标杆，中文海报+任意分辨率一键生成

CogView4 是智谱推出的开源文生图模型，支持中英双语输入和任意分辨率图像生成，特别优化了中文文字生成能力，适合广告、创意设计等场景。

# 图像识别 # 编解码 # 人工智能 # 测试技术 # Apache # 算法框架/工具

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

ViDoRAG：开源多模态文档检索框架，多智能体推理+图文理解精准解析文档

ViDoRAG 是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架，基于多智能体协作和动态迭代推理，显著提升复杂视觉文档的检索和生成效率。

# 云解析DNS # 图像识别 # 人工智能 # 自然语言处理 # 搜索推荐 # 数据库 # 决策智能

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

SongGen：三秒克隆音色！开源AI一键生成专业级歌曲，创作人必备神器

SongGen是由上海AI Lab、北京航空航天大学和香港中文大学联合推出的单阶段自回归Transformer模型，能够通过文本生成高质量歌曲，支持混合模式和双轨模式，显著提升生成歌曲的自然度和人声清晰度。

# 图像识别 # 数据采集 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 搜索推荐

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

AIMv2：苹果开源多模态视觉模型，自回归预训练革新图像理解

AIMv2 是苹果公司开源的多模态自回归预训练视觉模型，通过图像和文本的深度融合提升视觉模型的性能，适用于多种视觉和多模态任务。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 编解码 # PyTorch # 算法框架/工具

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Trae 接入 Claude 3.7：AI 编程工具界的“卷王”，完全免费使用！

Trae 是一款完全免费的AI编程工具，现已接入 Claude 3.7 模型，提供代码生成、调试等强大功能，支持多模态输入和上下文理解，用户可享受24小时高速服务，无需担心付费限制。Trae 支持多平台，安装简便，适合开发者快速上手。

# 图像识别 # 人工智能 # 自然语言处理 # IDE # 开发工具 # C++

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别