图像识别的搜索结果_热门_第15页-阿里云开发者社区

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Agent Laboratory：AI自动撰写论文，AMD开源自动完成科研全流程的多智能体框架

Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架，基于大型语言模型，能够加速科学发现、降低成本并提高研究质量。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 决策智能 # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Pipecat实战：5步快速构建语音与AI整合项目，创建你的第一个多模态语音 AI 助手

Pipecat 是一个开源的 Python 框架，专注于构建语音和多模态对话代理，支持与多种 AI 服务集成，提供实时处理能力，适用于语音助手、企业服务等场景。

# 图像识别 # 智能语音交互 # 人工智能 # 数据处理 # 语音技术 # 开发者 # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

OmAgent：轻松构建在终端设备上运行的 AI 应用，赋能手机、穿戴设备、摄像头等多种设备

OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架，支持多设备连接、高效模型集成，助力开发者快速构建复杂的多模态代理应用。

# 图像识别 # 人工智能 # 算法 # 前端开发 # NoSQL # 开发者

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

FilmAgent：多智能体共同协作制作电影，哈工大联合清华推出 AI 驱动的自动化电影制作工具

FilmAgent 是由哈工大与清华联合推出的AI电影自动化制作工具，通过多智能体协作实现从剧本生成到虚拟拍摄的全流程自动化。

# 图像识别 # 人工智能 # 自然语言处理 # 语音技术 # 决策智能 # 图形学

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

AgentSociety：告别纸上谈兵！AI社会模拟器预判政策漏洞：输入新规秒看30年后社会形态

AgentSociety 是清华大学推出的基于大语言模型的社会模拟器，通过构建类人心智的智能体模拟复杂社会行为，适用于政策沙盒测试、危机预警等场景。

# 图像识别 # 人工智能 # 分布式计算 # 监控 # 安全 # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

别让创意卡在工具链！MiniMax MCP Server：MiniMax 开源 MCP 服务打通多模态生成能力，视频语音图像一键全搞定

MiniMax MCP Server 是基于模型上下文协议的多模态生成中间件，支持通过文本指令调用视频生成、图像创作、语音合成及声音克隆等能力，兼容主流客户端实现跨平台调用，采用检索增强生成技术保障内容准确性。

# 图像识别 # 人工智能 # 中间件 # API # 语音技术 # 开发者

游客bnlxddh3fwntw

|

问答

天眼查是怎么获得企业工商信息的？

# 图像识别 # 云解析DNS

游客tqsxlcu6ie37g

|

问答

|

来自： ModelScope模型即服务

图文匹配：Clip模型介绍

# 图像识别 # 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 计算机视觉

codyinnowhere

|

问答

|

来自： ModelScope模型即服务

modelscope模型部署到PAI EAS上调试报错

# 人工智能平台 PAI # 自然语言处理 # 图像识别 # 测试技术

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

RDT：清华开源全球最大的双臂机器人操作任务扩散基础模型、代码与训练集，基于模仿能力机器人能够自主完成复杂任务

RDT（Robotics Diffusion Transformer）是由清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操作任务扩散基础模型。RDT具备十亿参数量，能够在无需人类操控的情况下自主完成复杂任务，如调酒和遛狗。

# 图像识别 # 传感器 # 人工智能 # 自然语言处理 # 机器人

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别