图像识别的搜索结果_热门_第12页-阿里云开发者社区

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

YuE：开源AI音乐生成模型，能够将歌词转化为完整的歌曲，支持多种语言和多种音乐风格

YuE 是香港科技大学和 M-A-P 联合开发的开源 AI 音乐生成模型，能够将歌词转化为完整的歌曲，支持多种音乐风格和多语言。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 内存技术

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Ola：清华联合腾讯等推出的全模态语言模型！实现对文本、图像、视频和音频的全面理解

Ola 是由清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型，支持文本、图像、视频和音频输入，并具备实时流式解码功能。

# 图像识别 # 人工智能 # 测试技术

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

MoneyPrinterTurbo：23.9K Star！这个AI把写文案+找素材+剪视频全包了，日更10条不是梦

MoneyPrinterTurbo 是一款功能强大的 AI 工具，支持通过主题或关键词自动生成视频文案、素材、字幕与背景音乐，并合成高清短视频，适合批量生成与多语言支持。

# 图像识别 # 人工智能 # 前端开发 # API # 语音技术 # Windows

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Mobile-Agent：通过视觉感知实现自动化手机操作，支持多应用跨平台

Mobile-Agent 是一款基于多模态大语言模型的智能代理，能够通过视觉感知自主完成复杂的移动设备操作任务，支持跨应用操作和纯视觉解决方案。

# 图像识别 # XML # 人工智能 # 文字识别 # 自然语言处理 # 决策智能

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分

Aider 是一款基于命令行的开源 AI 编程助手，支持多种编程语言和主流 LLM，可自动完成代码修改、Git 提交及语音交互。

# 图像识别 # 人工智能 # 自然语言处理 # JavaScript # 开发工具 # git

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

PC Agent：开源 AI 电脑智能体，自动收集人机交互数据，模拟认知过程实现办公自动化

PC Agent 是上海交通大学与 GAIR 实验室联合推出的智能 AI 系统，能够模拟人类认知过程，自动化执行复杂的数字任务，如组织研究材料、起草报告等，展现了卓越的数据效率和实际应用潜力。

# 图像识别 # 存储 # 人工智能 # 人机交互 # 决策智能

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

SpatialLM：手机视频秒建3D场景！开源空间认知模型颠覆机器人训练

SpatialLM 是群核科技开源的空间理解多模态模型，能够通过普通手机拍摄的视频重建 3D 场景布局，赋予机器人类似人类的空间认知能力，适用于具身智能训练、自动导航、AR/VR 等领域。

# 图像识别 # 数据采集 # 人工智能 # 数据可视化 # 机器人 # vr&ar

深语人工智能DeepNLP

|

博文

|

来自： ModelScope模型即服务

AI Agents Loop异步执行可视化Tutorial 借助AgentBoard工具可视化工作流

本文介绍了AI Agent的异步执行循环（Agent Loop），并展示了如何利用开源框架agentboard可视化这一过程。通过分析不同框架（如AutoGen、LangGraph、AutoAgent）对Agent Loop的抽象，文章详细说明了从简单的功能调用到复杂的多阶段执行流程的设计。此外，还提供了使用agentboard进行日志记录与流程可视化的具体示例，包括安装步骤、代码实现及运行方法，帮助开发者更高效地调试和优化AI Agent的应用。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 图像识别 # 日志服务 # 人工智能 # 数据可视化 # API # 算法框架/工具 # PyTorch

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Browser Use：开源 AI 浏览器助手，自动完成网页交互任务，支持多标签页管理、视觉识别和内容提取等功能

Browser Use 是一款专为大语言模型设计的智能浏览器工具，支持多标签页管理、视觉识别、内容提取等功能，并能记录和重复执行特定动作，适用于多种应用场景。

# 图像识别 # 人工智能 # API # 数据库 # 开发者

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Univer：开源全栈 AI 办公工具，支持 Word、Excel、PPT 等文档处理和多人实时协作

Univer 是一款开源的 AI 办公工具，支持 Word、Excel 等文档处理的全栈解决方案。它具有强大的功能、高度的可扩展性和跨平台兼容性，适用于个人和企业用户，能够显著提高工作效率。

# 图像识别 # 人工智能 # 自然语言处理 # JavaScript # 算法 # 前端开发

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别