ModelScope模型即服务-最新-第28页-阿里云开发者社区

蚝油菜花

|

人工智能算法安全

|

博文

OpenRouter 推出百万 token 上下文 AI 模型！Quasar Alpha：提供完全免费的 API 服务，同时支持联网搜索和多模态交互

Quasar Alpha 是 OpenRouter 推出的预发布 AI 模型，具备百万级 token 上下文处理能力，在代码生成、指令遵循和低延迟响应方面表现卓越，同时支持联网搜索和多模态交互。

1066 1 1

来自：多模态版块

蚝油菜花

|

人工智能语音技术

|

博文

ACTalker：港科大联合腾讯清华推出，多模态驱动的说话人视频生成神器

ACTalker是由香港科技大学联合腾讯、清华大学研发的端到端视频扩散框架，采用并行Mamba结构和多信号控制技术，能生成高度逼真的说话人头部视频。

573 0 0

来自：计算机视觉版块

蚝油菜花

|

数据采集人工智能安全

|

博文

32.7K Star！Awesome MCP Servers：开源MCP资源聚合平台，覆盖20+垂直领域

Awesome MCP Servers 是一个开源项目，汇集了3000多个基于Model Context Protocol的服务器实现，支持本地和云端部署，为AI大模型提供丰富的外部数据访问和工具调用能力。

2240 2 2

来自：自然语言处理版块

蚝油菜花

|

机器学习/深度学习人工智能编解码

|

博文

重定义数字人交互！OmniTalker：阿里推出实时多模态说话头像生成框架，音视频实现唇语级同步

阿里巴巴推出的OmniTalker框架通过Thinker-Talker架构实现文本驱动的实时说话头像生成，创新性采用TMRoPE技术确保音视频同步，支持流式多模态输入处理。

3614 2 8

来自：多模态版块

蚝油菜花

|

机器学习/深度学习人工智能

|

博文

OmniCam：浙大联合上海交大推出多模态视频生成框架，虚拟导演打造百万级影视运镜

OmniCam是由浙江大学与上海交通大学联合研发的多模态视频生成框架，通过LLM与视频扩散模型结合实现高质量视频生成，支持文本、轨迹和图像等多种输入模态。

510 1 1

来自：多模态版块

游客npnpl6d7rplm4

|

问答

想问一下modelscope里面的notebook现在安装不了llamafactory

280 0 0

游客etknkyy2ndsmi

|

问答

modelscope上传文件后无法下载，下载弹出无法下载，没有文件(如图)

287 0 0

不起名字可以不

|

SQL 自然语言处理数据可视化

|

博文

📊 Quick BI 真实体验评测：小白也能快速上手的数据分析工具！

作为一名软件开发工程师，我体验了阿里云的Quick BI工具。从申请试用账号到上传数据、创建数据集，再到搭建仪表板和使用智能小Q功能，整个过程流畅且简单易用。尤其对非专业数据分析人士来说，拖拽式设计和自然语言问数功能极大降低了操作门槛。虽然在试用入口明显度和复杂语义理解上还有提升空间，但整体体验令人满意。Quick BI让我改变了对数据分析的认知，值得推荐给需要快速制作报表的团队成员。

1369 3 3

蚝油菜花

|

人工智能 JSON 网络协议

|

博文

音乐人狂喜！AbletonMCP：让AI帮你写歌，一句话生成专业编曲，Demo级作品秒出

AbletonMCP 是一个开源项目，通过模型上下文协议（MCP）将 Ableton Live 与 Claude AI 连接，实现 AI 辅助音乐制作，支持创建、修改 MIDI 和音频轨道等操作。

1034 10 10

来自：多模态版块

蚝油菜花

|

人工智能自然语言处理算法

|

博文

科研论文翻译神器！BabelDOC：开源AI工具让PDF论文秒变双语对照，公式图表全保留

BabelDOC 是一款专为科学论文设计的开源AI翻译工具，采用先进的无损解析技术和智能布局识别算法，能完美保留原文格式并生成双语对照翻译。

3141 67 68

来自：自然语言处理版块

蚝油菜花

|

机器学习/深度学习人工智能自然语言处理

|

博文

这个模型让AI角色会说话还会演！MoCha：Meta联手滑铁卢大学打造对话角色视频生成黑科技

MoCha是由Meta与滑铁卢大学联合开发的端到端对话角色视频生成模型，通过创新的语音-视频窗口注意力机制实现精准的唇语同步和全身动作生成。

1192 12 13

来自：计算机视觉版块

开心工作室V(kaic_kaic)

|

小程序 Java 关系型数据库

|

博文

weixin163基于微信小程序的校园二手交易平台系统设计与开发ssm(文档+源码)_kaic

本文介绍了一款基于微信小程序的校园二手物品交易平台的开发与实现。该平台采用Java语言开发服务端，使用MySQL数据库进行数据存储，前端以微信小程序为载体，支持管理员和学生两种角色操作。管理员可管理用户、商品分类及信息、交易记录等，而学生则能注册登录、发布购买商品、参与交流论坛等。系统设计注重交互性和安全性，通过SSM框架优化开发流程，确保高效稳定运行，满足用户便捷交易的需求，推动校园资源共享与循环利用。

1253 12 12

蚝油菜花

|

人工智能测试技术 API

|

博文

PaperBench：OpenAI开源AI智能体评测基准，8316节点精准考核复现能力

PaperBench是OpenAI推出的开源评测框架，通过8316个评分节点系统评估AI智能体复现学术论文的能力，涵盖理论理解、代码实现到实验执行全流程。

949 30 35

来自：自然语言处理版块

蚝油菜花

|

机器学习/深度学习人工智能自然语言处理

|

博文

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

Dolphin是清华大学与海天瑞声联合研发的语音识别大模型，支持40种东方语言和22种中文方言，采用CTC-Attention混合架构，词错率显著低于同类模型。

5589 50 51

来自：语音版块

蚝油菜花

|

人工智能测试技术定位技术

|

博文

WorldScore：斯坦福开源世界生成模型评估新标杆：3000样本+九维指标，视频/4D/3D模型一网打尽

WorldScore是斯坦福大学提出的首个统一评估世界生成模型的基准测试，通过基于相机轨迹的布局规范和3000个多样化样本，全面评测生成内容的可控性、质量与动态性。

914 46 46

来自：计算机视觉版块

蚝油菜花

|

机器学习/深度学习人工智能编解码

|

博文

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

EasyControl Ghibli是基于扩散模型的AI工具，通过条件注入技术将普通照片转化为吉卜力动画风格，仅需100张训练样本即可精准还原标志性光影与色调特征。

1644 11 11

来自：计算机视觉版块

蚝油菜花

|

人工智能编解码自然语言处理

|

博文

DreamActor-M1：字节跳动推出AI动画黑科技，静态照片秒变生动视频

DreamActor-M1是字节跳动研发的AI图像动画框架，通过混合引导机制实现高保真人物动画生成，支持多语言语音驱动和形状自适应功能。

1106 40 43

来自：计算机视觉版块

蚝油菜花

|

机器学习/深度学习人工智能前端开发

|

博文

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

Meta最新开源的SWEET-RL框架通过优化多轮交互任务的信用分配机制，使Llama-3.1-8B模型在协作推理任务中的表现提升6%，性能达到顶尖大模型水平。

722 33 33

来自：自然语言处理版块

蚝油菜花

|

人工智能自然语言处理前端开发

|

博文

DeepSite：基于DeepSeek的开源AI前端开发神器，一键生成游戏/网页代码

DeepSite是基于DeepSeek-V3模型的在线开发工具，无需配置环境即可通过自然语言描述快速生成游戏、网页和应用代码，并支持实时预览效果，显著降低开发门槛。

2019 93 93

来自：自然语言处理版块

游客eddgckqm3vo3s

|

问答

创建notebook失败

189 0 0

modelscope

|

人工智能数据可视化 API

|

博文

开箱即用的可视化AI应用编排工具 Langflow，可调用魔搭免费API作为tool

ModelScope 社区基于优秀的开源可视化AI应用编排工具 Langflow 搭建了创空间，以方便社区开发者基于社区开源模型及免费魔搭 API-Inference，快速创建Agent应用、RAG应用并将其部署为API服务。

1906 14 14

蚝油菜花

|

人工智能安全虚拟化

|

博文

Cua：Mac用户狂喜！这个开源框架让AI直接接管你的电脑，快速实现AI自动化办公

Cua是一个结合高性能虚拟化与AI代理能力的开源框架，能在Apple Silicon上以接近原生性能运行虚拟机，并让AI直接操作系统应用。

2170 17 17

来自：自然语言处理版块

蚝油菜花

|

机器学习/深度学习人工智能编解码

|

博文

Text to Bark：让狗狗听懂人话！全球首个AI"狗语"生成器，137种狗狗口音任君挑选

ElevenLabs推出的Text to Bark是全球首个能将文本转换为逼真狗吠声的AI模型，支持多种犬种选择并适配智能家居设备，其核心技术基于深度神经网络训练。

2767 15 16

来自：语音版块

蚝油菜花

|

人工智能自然语言处理 API

|

博文

AutoAgent：无需编程！接入DeepSeek用自然语言创建和部署AI智能体！港大开源框架让AI智能体开发变成填空题

香港大学推出的AutoAgent框架通过自然语言交互实现零代码创建AI智能体，支持多模型接入与自动化工作流编排，在GAIA基准测试中表现优异。

1827 16 16

来自：自然语言处理版块

游客z4tr7ctjfoahk

|

人工智能

|

博文

如何筛选高流量的AI模型？

我会定期查看huggingface.co/spaces和replicate.com排行榜，关注优质博主以了解最新实用模型。例如，根据排行榜趋势，我用两天时间创建了[grokghibli](https://grokghibli.pro/)。不过，自定义驱动视频失败率较高，模型还需优化。如有产品改进建议，请随时告诉我！期待与大家交流探讨。

257 2 2

modelscope

|

传感器人工智能机器人

|

博文

杭州六小龙最新开源「空间理解模型」，保姆级教程来了！

前几天，“杭州六小龙”之一「群核科技」在GTC 2025大会开源了空间理解模型：SpatialLM。

921 3 3

modelscope

|

人工智能 IDE 测试技术

|

博文

通义灵码与魔搭Notebook深度集成：在线编码开箱即用，开发效率倍增

通义灵码2.0 AI程序员于2025年1月上线，目前已支持超过百万开发者。该工具的智能编程能力现已与阿里云AI模型开发平台魔搭ModelScope实现技术集成

698 0 0

modelscope

|

机器学习/深度学习自然语言处理人机交互

|

博文

重磅发布｜支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源啦！

在当今数字化时代，语音识别技术已成为人机交互的关键桥梁，广泛应用于智能客服、语音助手、会议转录等众多领域。

939 0 0

yyacount

|

问答

modelscope免费实例支持vscode远程连接吗

293 0 0

游客2d4cqs7amspr6

|

编解码测试技术计算机视觉

|

问答

如何通过对应用程序界面截图中的功能做图像识别对比缺陷

319 0 0

来自：计算机视觉版块

蚝油菜花

|

机器学习/深度学习人工智能自然语言处理

|

博文

32B小模型竟能吊打百亿参数？GLM-4-Air-0414：智谱AutoGLM沉思背后的模型，智能体开发迎来新纪元

GLM-4-Air-0414是智谱公司推出的320亿参数开源基座模型，通过优化预训练数据和对齐策略，在工具调用、联网搜索和代码生成等智能体任务中展现出卓越性能。

735 15 15

蚝油菜花

|

机器学习/深度学习存储人工智能

|

博文

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

Qlib是微软亚洲研究院推出的开源AI量化投资平台，提供从数据处理、模型训练到组合管理的全流程支持，内置高性能数据基础设施和多种机器学习模型。

5463 87 88

来自：自然语言处理版块

蚝油菜花

|

机器学习/深度学习人工智能搜索推荐

|

博文

AutoGLM沉思：智谱AI推出首个能"边想边干"的自主智能体！深度研究+多模态交互，颠覆传统AI工作模式

AutoGLM沉思是由智谱AI推出的一款开创性AI智能体，它突破性地将深度研究能力与实际操作能力融为一体，实现了AI从被动响应到主动执行的跨越式发展。

1539 16 16

来自：多模态版块

蚝油菜花

|

机器学习/深度学习人工智能数据可视化

|

博文

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

GLM-Z1-Rumination是智谱推出的新一代沉思模型，通过扩展强化学习训练实现长程推理能力，支持动态工具调用与自我验证机制，显著提升AI自主研究能力。

667 13 14

来自：自然语言处理版块

蚝油菜花

|

人工智能 API 计算机视觉

|

博文

AI-ClothingTryOn：服装店老板连夜下架试衣间！基于Gemini开发的AI试衣应用，一键生成10种穿搭效果

AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用，支持人物与服装照片智能合成，可生成多达10种试穿效果版本，并提供自定义提示词优化功能。

1148 18 18

来自：计算机视觉版块

蚝油菜花

|

人工智能算法

|

博文

Runway Gen-4：AI视频生成新纪元！高保真特效一键生成影视级内容

Runway Gen-4是新一代AI视频生成模型，通过参考图和文字指令即可生成具有物理真实感、叙事连贯性的高质量视频内容，支持与实拍素材无缝融合。

1107 9 9

来自：计算机视觉版块

蚝油菜花

|

机器学习/深度学习人工智能监控

|

博文

Amodal3R：3D重建领域新突破！这个模型让残破文物完美还原，3D重建结果助力文物修复

Amodal3R是一种创新的条件式3D生成模型，通过掩码加权多头交叉注意力机制和遮挡感知层，能够从部分可见的2D图像中重建完整3D形态，仅用合成数据训练即可实现真实场景的高精度重建。

620 13 13

来自：计算机视觉版块

蚝油菜花

|

人工智能编解码异构计算

|

博文

Neo-1：全球首个原子级生成式AI模型！这个AI模型把10年药物研发周期压缩到1个月

VantAI推出的Neo-1是全球首个统一分子生成与原子级结构预测的AI模型，采用潜在空间扩散技术，结合大规模训练和定制数据集，显著提升药物研发效率。

723 15 15

来自：科学计算版块

蚝油菜花

|

人工智能

|

博文

Hi3DGen：2D照片秒变高精度模型，毛孔级细节完爆Blender！港中文×字节×清华联手打造3D生成黑科技

Hi3DGen是由香港中文大学、字节跳动和清华大学联合研发的高保真3D几何生成框架，通过法线图中间表示实现细节丰富的3D模型生成，其双阶段生成流程显著提升了几何保真度。

1532 32 33

来自：计算机视觉版块

蚝油菜花

|

人工智能搜索推荐前端开发

|

博文

OpenDeepSearch：搜索引擎革命！这个开源深度搜索工具让AI代理直接读懂网页，复杂问题一键拆解

OpenDeepSearch是基于开源推理模型的深度搜索工具，通过语义重排和多源整合优化检索效果，支持与AI代理无缝集成，提供快速和专业两种搜索模式。

934 10 10

来自：自然语言处理版块

CloudPeak98-44019

|

语音技术

|

问答

funasr 微调没有效果？微调数据量是多少，如何调整batch_size

508 0 0

来自：语音版块

蚝油菜花

|

机器学习/深度学习人工智能

|

博文

ObjectMover：港大联合Adobe打造图像编辑黑科技，移动物体光影自动匹配

香港大学与Adobe联合研发的ObjectMover模型，通过视频生成先验迁移技术，实现图像中物体的自然移动、删除和插入，自动保持光影一致性。

456 21 21

来自：计算机视觉版块

蚝油菜花

|

人工智能图形学

|

博文

PhysGen3D：清华等高校联合推出，单图秒变交互式3D场景

PhysGen3D是清华等高校联合开发的创新框架，通过单张图像重建3D场景并模拟物理行为，实现从静态图像到动态交互的突破性转换。

536 15 15

来自：计算机视觉版块

蚝油菜花

|

人工智能前端开发算法

|

博文

Vibe Draw：涂鸦秒变3D模型！开源AI建模神器解放创意生产力

Vibe Draw 是一款基于AI技术的开源3D建模工具，通过Next.js和FastAPI构建，能将用户绘制的2D草图智能转化为3D模型，并支持文本提示优化和场景构建。

1030 35 35

来自：计算机视觉版块

蚝油菜花

|

机器学习/深度学习人工智能自然语言处理

|

博文

PaddleSpeech：百度飞桨开源语音处理神器，识别合成翻译全搞定

PaddleSpeech是百度飞桨团队推出的开源语音处理工具包，集成语音识别、合成、翻译等核心技术，基于PaddlePaddle框架提供高性能解决方案。

1391 18 18

来自：语音版块

蚝油菜花

|

人工智能 API 语音技术

|

博文

EmotiVoice：网易开源AI语音合成黑科技，2000+音色情感可控

EmotiVoice是网易有道开源的多语言语音合成系统，支持中英文2000多种音色，通过提示词控制情感输出，提供Web界面和API接口，具备语音克隆等先进功能。

2001 43 44

来自：语音版块

蚝油菜花

|

人工智能数据可视化 C++

|

博文

Math24o：SuperCLUE开源的高中奥数推理测评基准，85.71分屠榜

Math24o是首个针对高中奥林匹克数学竞赛的中文大模型测评基准，采用2024年预赛真题实现自动化评估，为模型数学推理能力提供客观衡量标准。

538 48 48

来自：科学计算版块

蚝油菜花

|

人工智能搜索推荐图形学

|

博文

ChatAnyone：阿里通义黑科技！实时风格化肖像视频生成框架震撼发布

阿里巴巴通义实验室推出的ChatAnyone框架，通过高效分层运动扩散模型和混合控制融合技术，实现高保真度、自然度的实时肖像视频生成。

653 13 13

来自：计算机视觉版块

modelscope

|

文字识别测试技术语音技术

|

博文

看听说写四维突破：Qwen2.5-Omni 端到端多模态模型开源！

今天，通义千问团队发布了 Qwen2.5-Omni，Qwen 模型家族中新一代端到端多模态旗舰模型。该模型专为全方位多模态感知设计，能够无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时生成文本与自然语音合成输出。

3513 6 7

modelscope

|

人工智能自然语言处理搜索推荐

|

博文

WritingBench：阿里最新大模型写作能力多维测评工具，开源32B深度思考写作模型

近日，阿里研究团队联合中国人民大学和上海交通大学共同开源了WritingBench ——该评估基准覆盖6大领域、100个细分场景，共包含1239条评测数据，以期为生成式写作提供全面的评估。团队进一步发现，凭借思维链技术和动态评估体系的加持，基于Qwen开发的32B创作模型在创意型任务上表现接近顶尖模型R1，为高效能创作开辟了新路径。

1717 5 5

最新

文章

视频

问答

推荐

OpenRouter 推出百万 token 上下文 AI 模型！Quasar Alpha：提供完全免费的 API 服务，同时支持联网搜索和多模态交互

ACTalker：港科大联合腾讯清华推出，多模态驱动的说话人视频生成神器

32.7K Star！Awesome MCP Servers：开源MCP资源聚合平台，覆盖20+垂直领域

重定义数字人交互！OmniTalker：阿里推出实时多模态说话头像生成框架，音视频实现唇语级同步

OmniCam：浙大联合上海交大推出多模态视频生成框架，虚拟导演打造百万级影视运镜

想问一下modelscope里面的notebook现在安装不了llamafactory

modelscope上传文件后无法下载，下载弹出无法下载，没有文件(如图)

📊 Quick BI 真实体验评测：小白也能快速上手的数据分析工具！

音乐人狂喜！AbletonMCP：让AI帮你写歌，一句话生成专业编曲，Demo级作品秒出

科研论文翻译神器！BabelDOC：开源AI工具让PDF论文秒变双语对照，公式图表全保留

这个模型让AI角色会说话还会演！MoCha：Meta联手滑铁卢大学打造对话角色视频生成黑科技

weixin163基于微信小程序的校园二手交易平台系统设计与开发ssm(文档+源码)_kaic

PaperBench：OpenAI开源AI智能体评测基准，8316节点精准考核复现能力

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

WorldScore：斯坦福开源世界生成模型评估新标杆：3000样本+九维指标，视频/4D/3D模型一网打尽

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

DreamActor-M1：字节跳动推出AI动画黑科技，静态照片秒变生动视频

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

DeepSite：基于DeepSeek的开源AI前端开发神器，一键生成游戏/网页代码

创建notebook失败

开箱即用的可视化AI应用编排工具 Langflow，可调用魔搭免费API作为tool

Cua：Mac用户狂喜！这个开源框架让AI直接接管你的电脑，快速实现AI自动化办公

Text to Bark：让狗狗听懂人话！全球首个AI"狗语"生成器，137种狗狗口音任君挑选

AutoAgent：无需编程！接入DeepSeek用自然语言创建和部署AI智能体！港大开源框架让AI智能体开发变成填空题

如何筛选高流量的AI模型？

杭州六小龙最新开源「空间理解模型」，保姆级教程来了！

通义灵码与魔搭Notebook深度集成：在线编码开箱即用，开发效率倍增

重磅发布｜支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源啦！

modelscope免费实例支持vscode远程连接吗

如何通过对应用程序界面截图中的功能做图像识别对比缺陷

32B小模型竟能吊打百亿参数？GLM-4-Air-0414：智谱AutoGLM沉思背后的模型，智能体开发迎来新纪元

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

AutoGLM沉思：智谱AI推出首个能"边想边干"的自主智能体！深度研究+多模态交互，颠覆传统AI工作模式

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

AI-ClothingTryOn：服装店老板连夜下架试衣间！基于Gemini开发的AI试衣应用，一键生成10种穿搭效果

Runway Gen-4：AI视频生成新纪元！高保真特效一键生成影视级内容

Amodal3R：3D重建领域新突破！这个模型让残破文物完美还原，3D重建结果助力文物修复

Neo-1：全球首个原子级生成式AI模型！这个AI模型把10年药物研发周期压缩到1个月

Hi3DGen：2D照片秒变高精度模型，毛孔级细节完爆Blender！港中文×字节×清华联手打造3D生成黑科技

OpenDeepSearch：搜索引擎革命！这个开源深度搜索工具让AI代理直接读懂网页，复杂问题一键拆解

funasr 微调没有效果？微调数据量是多少，如何调整batch_size

ObjectMover：港大联合Adobe打造图像编辑黑科技，移动物体光影自动匹配

PhysGen3D：清华等高校联合推出，单图秒变交互式3D场景

Vibe Draw：涂鸦秒变3D模型！开源AI建模神器解放创意生产力

PaddleSpeech：百度飞桨开源语音处理神器，识别合成翻译全搞定

EmotiVoice：网易开源AI语音合成黑科技，2000+音色情感可控

Math24o：SuperCLUE开源的高中奥数推理测评基准，85.71分屠榜

ChatAnyone：阿里通义黑科技！实时风格化肖像视频生成框架震撼发布

看听说写四维突破：Qwen2.5-Omni 端到端多模态模型开源！

WritingBench：阿里最新大模型写作能力多维测评工具，开源32B深度思考写作模型

ModelScope模型即服务

活跃用户

相关产品