ModelScope模型即服务-最新-第26页-阿里云开发者社区

蚝油菜花

|

人工智能自然语言处理监控

|

博文

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！

Cooragent 是清华大学 LeapLab 团队推出的开源 AI Agent 协作框架，支持基于简单描述快速创建 Agent 并实现多 Agent 协作，具备 Prompt-Free 设计和本地部署能力。

1565 6 9

来自：自然语言处理版块

蚝油菜花

|

人工智能自然语言处理监控

|

博文

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

LongPort MCP是长桥集团推出的证券行业首个券商模型上下文协议，通过标准化接口实现AI与金融服务的无缝对接，支持自然语言交互的智能投资服务。

2423 8 9

来自：自然语言处理版块

蚝油菜花

|

机器学习/深度学习人工智能算法

|

博文

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策

RAGEN是一个基于StarPO框架的开源强化学习系统，通过马尔可夫决策过程形式化Agent与环境的交互，支持PPO、GRPO等多种优化算法，显著提升多轮推理训练的稳定性。

1666 5 5

来自：多模态版块

f杂七杂八f

|

问答

模型部署服务部署后，使用参考OpenAPI请求示例代码，运行报Error code: 412

226 0 0

蚝油菜花

|

机器学习/深度学习人工智能物联网

|

博文

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！

Flex.2-preview是Ostris开源的80亿参数文本到图像扩散模型，支持512token长文本输入和多类型控制引导，内置修复功能并兼容主流AI绘画工具链。

785 3 3

来自：多模态版块

modelscope

|

存储人工智能编解码

|

博文

"一丹一世界"二等奖 | MAJICFLUS_新浮世创作分享

411 2 3

modelscope

|

存储机器学习/深度学习芯片

|

博文

微软推出bitnet-b1.58-2B-4T：极致的量化，小巧而强大

随着大语言模型的发展，参数量逐渐扩大，大语言模型的训练和运行通常需要大量的计算资源，这也限制了大语言模型在一些场景尤其是端侧的应用，所以，探索剪枝，蒸馏等量化方式，已经成为大语言模型研究的一个重要方向。

1354 3 3

modelscope

|

人工智能自然语言处理物联网

|

博文

"一丹一世界"二等奖 | TPSZ_二次元卡通梦幻插画风格-童梦拾光创作分享

457 7 8

modelscope

|

前端开发机器人 API

|

博文

答疑机器人实践：AgentScope多智能体带你玩转多源召回

660 3 3

modelscope

|

机器学习/深度学习自然语言处理物联网

|

博文

Prot2Chat：融合蛋白质序列与结构的新型问答框架

376 1 1

modelscope

|

机器学习/深度学习编解码缓存

|

博文

通义万相2.1首尾帧模型开源！细节真实生动+过渡丝滑，指令遵循表现出色！

1944 7 7

modelscope

|

编解码开发者

|

博文

ImagePulse图律脉动数据集开源发布：解码GPT-4o级图像生成能力，四大原子数据集+自动生成工具开放

434 3 3

modelscope

|

人工智能自然语言处理算法

|

博文

"一丹一世界"一等奖 | 曙光_麦橘超然创作分享

380 4 5

modelscope

|

机器学习/深度学习人工智能算法

|

博文

HumanRig：高德地图提出在大规模数据集中学习人形角色的自动绑定技术，数据集开源！

705 88 89

蚝油菜花

|

人工智能自然语言处理数据可视化

|

博文

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！

WriteHERE是基于异质递归规划技术的开源AI写作框架，能动态分解写作任务并管理任务依赖关系，支持单次生成超过4万字的专业报告。

2610 55 57

来自：自然语言处理版块

蚝油菜花

|

人工智能编解码算法

|

博文

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

MAGI-1是Sand AI开源的全球首个自回归视频生成大模型，采用创新架构实现高分辨率流畅视频生成，支持无限扩展和精细控制，在物理行为预测方面表现突出。

1539 1 1

来自：多模态版块

蚝油菜花

|

人工智能缓存自然语言处理

|

博文

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定

Suna是由Kortix推出的开源通用型AI智能体项目，通过自然语言交互实现浏览器自动化、文件管理、数据分析等复杂任务处理，支持自托管部署，为研究分析和日常工作提供智能辅助。

2834 55 56

来自：自然语言处理版块

蚝油菜花

|

人工智能自然语言处理知识图谱

|

博文

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台，支持多格式文档处理和复杂知识关系查询，具备多模型适配和智能体拓展能力。

3914 55 56

来自：自然语言处理版块

蚝油菜花

|

人工智能自然语言处理运维

|

博文

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

ChatTS-14B是字节跳动开源的时间序列专用大模型，基于Qwen2.5-14B微调优化，通过合成数据对齐技术显著提升分析能力，支持自然语言交互完成预测推理等复杂任务。

3232 1 1

来自：自然语言处理版块

蚝油菜花

|

人工智能算法数据可视化

|

博文

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱

上海AI Lab推出的Infinite Mobility采用程序化生成技术，可高效生成22类高质量可交互物体，单个生成仅需1秒且成本低至0.01元，已应用于机器人仿真训练等领域。

1056 2 2

来自：多模态版块

蚝油菜花

|

机器学习/深度学习人工智能自然语言处理

|

博文

还在想开题报告？SurveyGO卷姬：清华开源学术论文AI写作神器，一键生成文献综述

SurveyGO是清华与面壁智能联合开源的AI论文写作工具，采用LLMxMapReduce-V2技术实现文献智能聚合，能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。

1780 1 1

来自：自然语言处理版块

蚝油菜花

|

人工智能搜索推荐

|

博文

「社会实验室」成真！SocioVerse：复旦联合小红书开源社会模拟世界模型，用AI预演群体行为

SocioVerse是由复旦大学联合小红书等机构开源的社会模拟框架，基于大语言模型和千万级真实用户数据构建，能精准模拟群体行为并预测社会事件演化趋势。

1180 2 2

来自：自然语言处理版块

蚝油菜花

|

人工智能 IDE API

|

博文

白板秒变IDE，草图直接生成可运行代码！Pad.ws：白板+代码编辑器深度结合，创意到实现无缝衔接

Pad.ws是一款创新的在线开发环境，将交互式白板与完整IDE工具深度结合，支持多人实时协作和多种编程语言，无需安装即可通过浏览器访问。

988 1 1

来自：自然语言处理版块

深语人工智能DeepNLP

|

人工智能 JSON 定位技术

|

博文

地图类MCP 从0-1构建行程规划Agent 之 DeepNLP MCP应用市场

本文重点介绍借助DeepNLP的MCP应用市场中 MCP Server的JSON文件配置，在 Cursor客户端从0-1构建一个行程规划AI AGENT，为行程规划类的AI AGENT。五一假期期间帮助用户把自己电脑变成一个超级AI AGENT智能体。目前主要使用了Google Map/Baidu Map和高德AMAP的MCP，实现如北京到上海的三天火车旅行规划。内容涵盖基础设置准备、Agent Mode测试及不同地图服务的横向对比与具体配置方法（如NPX、Docker、Python等）。

577 10 10

ej3mlsntrfzkw

|

Python 数据可视化

|

问答

关于lmdeploy+InternLV3-1B运行报错的问题

168 0 0

游客rtjgauq3fqjz4

|

API

|

问答

QwQ为什么联网搜索没有返回搜索结果呀，搜索结果为空

291 0 0

蚝油菜花

|

人工智能 Linux iOS开发

|

博文

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

OpenUtau是一款开源的歌声合成工具，兼容UTAU音源库和重采样器，支持多语言界面及预渲染功能，让音乐创作更加高效便捷。

4465 15 15

来自：多模态版块

蚝油菜花

|

机器学习/深度学习人工智能知识图谱

|

博文

视觉分词器突破天花板！GigaTok：港大字节联手打造3B参数视觉分词器，突破图像生成瓶颈

GigaTok是香港大学与字节跳动联合研发的3B参数视觉分词器，通过语义正则化技术和创新架构设计，解决了图像重建与生成质量间的矛盾，显著提升自回归模型的表示学习能力。

455 4 4

来自：多模态版块

蚝油菜花

|

机器学习/深度学习人工智能编解码

|

博文

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图

SimpleAR是复旦大学与字节Seed团队联合研发的自回归图像生成模型，仅用5亿参数即可生成1024×1024分辨率的高质量图像，在GenEval等基准测试中表现优异。

598 4 4

来自：多模态版块

蚝油菜花

|

人工智能 API 开发者

|

博文

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

FastAPI-MCP是一款能将FastAPI应用端点自动转换为符合模型上下文协议(MCP)的开源工具，支持零配置自动发现接口并保留完整文档和模式定义。

6110 113 121

来自：自然语言处理版块

蚝油菜花

|

人工智能并行计算 Linux

|

博文

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度，解决视频生成中的"遗忘"和"漂移"问题，仅需6GB显存即可在普通笔记本上实时生成高清视频。

2870 19 19

来自：多模态版块

九霄碧落不及你

|

自然语言处理 Python

|

问答

在下载modelscope[nlp]时会卡住

435 0 0

XiaoPenYou

|

机器学习/深度学习算法 NoSQL

|

博文

记录转大模型—InitCommit

嗯，写点东西记录一下转大模型的经历。

299 14 14

来自：自然语言处理版块

游客wpxdn2crttcjk

|

物联网

|

问答

大模型Lora微调的疑问

255 0 0

蚝油菜花

|

机器学习/深度学习人工智能编解码

|

博文

AI视频生成也能自动补全！Wan2.1 FLF2V：阿里通义开源14B视频生成模型，用首尾两帧生成过渡动画

万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型，基于DiT架构和高效视频压缩VAE，能够根据首尾帧图像自动生成5秒720p高清视频，支持多种风格变换和细节复刻。

3165 9 10

来自：多模态版块

蚝油菜花

|

人工智能自然语言处理监控

|

博文

基于DeepSeek R1改进的AI安全模型！MAI-DS-R1：微软开源AI安全卫士，敏感话题响应率高达99.3%

微软开源的MAI-DS-R1是基于DeepSeek R1改进的AI模型，通过后训练优化将敏感话题响应率提升至99.3%，同时将有害内容风险降低50%，保持原版推理能力并增强多语言支持。

1534 3 3

来自：自然语言处理版块

游客5wtrclld4ysfm

|

问答

HDL文件分析并理解其中的拓扑结构

215 0 0

来自：多模态版块

蚝油菜花

|

人工智能 JSON 自然语言处理

|

博文

让AI听懂你的建模需求！BlenderMCP：自然语言指令直接操控 Blender，一句话生成复杂3D场景

BlenderMCP通过MCP协议实现Blender与Claude AI的无缝集成，支持通过自然语言指令完成3D建模、材质调整等复杂操作，显著提升创作效率。

1831 1 1

来自：自然语言处理版块

蚝油菜花

|

人工智能自然语言处理测试技术

|

博文

自然语言生成代码一键搞定！Codex CLI：OpenAI开源终端AI编程助手，代码重构+测试全自动

Codex CLI是OpenAI推出的轻量级AI编程智能体，基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制，支持代码生成、重构、测试及数据库迁移等功能。

3486 1 1

来自：自然语言处理版块

蚝油菜花

|

人工智能自然语言处理图形学

|

博文

多模态交互3D建模革命！Neural4D 2o：文本+图像一键生成高精度3D内容

Neural4D 2o是DreamTech推出的突破性3D大模型，通过文本、图像、3D和运动数据的联合训练，实现高精度3D生成与智能编辑，为创作者提供全新的多模态交互体验。

1043 0 0

来自：多模态版块

蚝油菜花

|

人工智能算法 API

|

博文

多模态模型卷王诞生！InternVL3：上海AI Lab开源78B多模态大模型，支持图文视频全解析！

上海人工智能实验室开源的InternVL3系列多模态大语言模型，通过原生多模态预训练方法实现文本、图像、视频的统一处理，支持从1B到78B共7种参数规模。

1803 6 6

来自：多模态版块

蚝油菜花

|

人工智能自然语言处理 JavaScript

|

博文

测试工程师要失业？Magnitude：开源AI Agent驱动的端到端测试框架，让Web测试更智能，自动完善测试用例！

Magnitude是一个基于视觉AI代理的开源端到端测试框架，通过自然语言构建测试用例，结合推理代理和视觉代理实现智能化的Web应用测试，支持本地运行和CI/CD集成。

2439 15 15

来自：自然语言处理版块

蚝油菜花

|

人工智能自然语言处理搜索推荐

|

博文

AI对话像真人！交交：上海交大推出全球首个口语对话情感大模型，支持多语言与实时音色克隆

上海交通大学推出的交交是全球首个纯学术界自研的口语对话情感大模型，具备多语言交流、方言理解、角色扮演和情感互动等能力，通过创新技术实现端到端语音对话和实时音色克隆。

1214 14 14

来自：多模态版块

蚝油菜花

|

人工智能编解码

|

博文

导演失业预警！Seaweed-7B：字节7B参数模型让剧本自动变电影！20秒长镜头丝滑生成

Seaweed-7B是字节跳动推出的70亿参数视频生成模型，支持从文本、图像或音频生成高质量视频内容，具备长镜头生成、实时渲染等先进特性，通过优化架构显著降低计算成本。

680 10 11

来自：多模态版块

蚝油菜花

|

机器学习/深度学习人工智能 PyTorch

|

博文

模型手动绑骨3天，AI花3分钟搞定！UniRig：清华开源通用骨骼自动绑定框架，助力3D动画制作

UniRig是清华大学与VAST联合研发的自动骨骼绑定框架，基于自回归模型与交叉注意力机制，支持多样化3D模型的骨骼生成与蒙皮权重预测，其创新的骨骼树标记化技术显著提升动画制作效率。

2484 27 28

来自：多模态版块

蚝油菜花

|

机器学习/深度学习人工智能算法

|

博文

GPT-4.5 竟成小丑！OpenAI 推出 GPT-4.1：百万级上下文多模态语言模型，性价比远超 GPT-4o mini

OpenAI最新发布的GPT-4.1系列语言模型通过混合专家架构与上下文优化，实现百万级token处理能力，在编码任务中准确率提升21.4%，推理成本降低83%，支持多模态内容理解与低延迟响应。

866 27 27

来自：自然语言处理版块

蚝油菜花

|

人工智能数据可视化数据挖掘

|

博文

AI竟能独立完成顶会论文！The AI Scientist-v2：开源端到端AI自主科研系统，自动探索科学假设生成论文

The AI Scientist-v2 是由 Sakana AI 等机构开发的端到端自主科研系统，通过树搜索算法与视觉语言模型反馈实现科学假设生成、实验执行及论文撰写全流程自动化，其生成论文已通过国际顶会同行评审。

1458 34 36

来自：自然语言处理版块

蚝油菜花

|

机器学习/深度学习人工智能编解码

|

博文

告别潜在空间的黑箱操作，直接在原始像素空间建模！PixelFlow：港大团队开源像素级文生图模型

香港大学与Adobe联合研发的PixelFlow模型，通过流匹配和多尺度生成技术实现像素级图像生成，在256×256分辨率任务中取得1.98的FID分数，支持端到端训练并突破传统模型对预训练VAE的依赖。

807 36 36

来自：多模态版块

蚝油菜花

|

人工智能中间件 API

|

博文

别让创意卡在工具链！MiniMax MCP Server：MiniMax 开源 MCP 服务打通多模态生成能力，视频语音图像一键全搞定

MiniMax MCP Server 是基于模型上下文协议的多模态生成中间件，支持通过文本指令调用视频生成、图像创作、语音合成及声音克隆等能力，兼容主流客户端实现跨平台调用，采用检索增强生成技术保障内容准确性。

1404 3 3

来自：多模态版块

蚝油菜花

|

人工智能前端开发语音技术

|

博文

开源学习神器把2小时网课压成5分钟脑图！BiliNote：一键转录哔哩哔哩视频，生成结构化学习文档

本文介绍基于FastAPI与React构建的开源视频笔记工具BiliNote，其整合多模态AI技术实现视频内容结构化解析，支持跨平台视频源处理与本地化部署方案，提供从语音转写到智能摘要的全流程自动化能力。

2902 36 37

来自：多模态版块

最新

文章

视频

问答

推荐

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策

模型部署服务部署后，使用参考OpenAPI请求示例代码，运行报Error code: 412

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！

"一丹一世界"二等奖 | MAJICFLUS_新浮世 创作分享

微软推出bitnet-b1.58-2B-4T：极致的量化，小巧而强大

"一丹一世界"二等奖 | TPSZ_二次元卡通梦幻插画风格-童梦拾光 创作分享

答疑机器人实践：AgentScope多智能体带你玩转多源召回

Prot2Chat：融合蛋白质序列与结构的新型问答框架

通义万相2.1首尾帧模型开源！细节真实生动+过渡丝滑，指令遵循表现出色！

ImagePulse图律脉动数据集开源发布：解码GPT-4o级图像生成能力，四大原子数据集+自动生成工具开放

"一丹一世界"一等奖 | 曙光_麦橘超然 创作分享

HumanRig：高德地图提出在大规模数据集中学习人形角色的自动绑定技术，数据集开源！

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱

还在想开题报告？SurveyGO卷姬：清华开源学术论文AI写作神器，一键生成文献综述

「社会实验室」成真！SocioVerse：复旦联合小红书开源社会模拟世界模型，用AI预演群体行为

白板秒变IDE，草图直接生成可运行代码！Pad.ws：白板+代码编辑器深度结合，创意到实现无缝衔接

地图类MCP 从0-1构建行程规划Agent 之 DeepNLP MCP应用市场

关于lmdeploy+InternLV3-1B运行报错的问题

QwQ为什么联网搜索没有返回搜索结果呀，搜索结果为空

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

视觉分词器突破天花板！GigaTok：港大字节联手打造3B参数视觉分词器，突破图像生成瓶颈

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

在下载modelscope[nlp]时会卡住

记录转大模型—InitCommit

大模型Lora微调的疑问

AI视频生成也能自动补全！Wan2.1 FLF2V：阿里通义开源14B视频生成模型，用首尾两帧生成过渡动画

基于DeepSeek R1改进的AI安全模型！MAI-DS-R1：微软开源AI安全卫士，敏感话题响应率高达99.3%

HDL文件分析并理解其中的拓扑结构

让AI听懂你的建模需求！BlenderMCP：自然语言指令直接操控 Blender，一句话生成复杂3D场景

自然语言生成代码一键搞定！Codex CLI：OpenAI开源终端AI编程助手，代码重构+测试全自动

多模态交互3D建模革命！Neural4D 2o：文本+图像一键生成高精度3D内容

多模态模型卷王诞生！InternVL3：上海AI Lab开源78B多模态大模型，支持图文视频全解析！

测试工程师要失业？Magnitude：开源AI Agent驱动的端到端测试框架，让Web测试更智能，自动完善测试用例！

AI对话像真人！交交：上海交大推出全球首个口语对话情感大模型，支持多语言与实时音色克隆

导演失业预警！Seaweed-7B：字节7B参数模型让剧本自动变电影！20秒长镜头丝滑生成

模型手动绑骨3天，AI花3分钟搞定！UniRig：清华开源通用骨骼自动绑定框架，助力3D动画制作

GPT-4.5 竟成小丑！OpenAI 推出 GPT-4.1：百万级上下文多模态语言模型，性价比远超 GPT-4o mini

AI竟能独立完成顶会论文！The AI Scientist-v2：开源端到端AI自主科研系统，自动探索科学假设生成论文

告别潜在空间的黑箱操作，直接在原始像素空间建模！PixelFlow：港大团队开源像素级文生图模型

别让创意卡在工具链！MiniMax MCP Server：MiniMax 开源 MCP 服务打通多模态生成能力，视频语音图像一键全搞定

开源学习神器把2小时网课压成5分钟脑图！BiliNote：一键转录哔哩哔哩视频，生成结构化学习文档

ModelScope模型即服务

活跃用户

相关产品

"一丹一世界"二等奖 | MAJICFLUS_新浮世创作分享

"一丹一世界"二等奖 | TPSZ_二次元卡通梦幻插画风格-童梦拾光创作分享

"一丹一世界"一等奖 | 曙光_麦橘超然创作分享