ModelScope内容运营小助手_高分内容_个人页-阿里云开发者社区

近年来，视觉语言模型（VLM）取得了显著进展，然而，现有的开源数据和指令数据集在数量和质量上依然落后，基于开源数据训练的模型在效果上仍然远落后于 SOTA 闭源模型或使用专有数据训练的开源模型。为解决以上问题，进一步提升开源模型的性能，2024年10月25日，智源研究院发布并开源了千万级多模态指令数据集Infinity-MM。

发表了文章 2024-11-11

魔搭社区每周速递（10.27-11.09）

4221个模型、112个数据集、95个创新应用、14篇应用文章

发表了文章 2024-11-11

让你的Notebook飞起来！开发体验再上新台阶

魔搭社区ModelScope最近针对大家积极反馈的Notebook功能进行了多方面的体验升级！这次的升级加入了许多令人兴奋的新特性，在很大程度上提升了Notebook的开发效率和体验。一起来看看这些新功能吧！

发表了文章 2024-11-11

上交大、上海人工智能实验室开源首个多轮安全对齐数据集 SafeMTData

最近，以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升，在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称，推理可以让模型更好的遵守安全政策，是提升模型安全的新路径。

发表了文章 2024-11-08

AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营

10月30日，由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·吉林大学站圆满结营。

发表了文章 2024-11-08

NeurIPS D&B 2024 突破短视频局限！MMBench-Video解读MLLM视频理解能力

GPT-4o 四月发布会掀起了视频理解的热潮，而开源领军者Qwen2也对视频毫不手软，在各个视频评测基准上狠狠秀了一把肌肉。

发表了文章 2024-11-07

打破文本边界：如何进行多模态RAG评估

一般的检索增强生成（RAG，Retrieval-Augmented Generation）方法主要依赖于文本数据，常常忽略了图像中的丰富信息。那么应该如何解决呢？本文带你了解一下这个模型。

发表了文章 2024-11-06

现在，一行命令使用Ollama运行任意魔搭GGUF模型

为了让开发者更方便地把这些模型用起来，社区最近支持了Ollama框架和ModelScope平台的链接，通过简单的 ollama run命令，就能直接加载运行ModelScope模型库上的GGUF模型。

发表了文章 2024-11-06

AI+硬件最新资讯合集（2024-11-05第2期）

一起来看看AI+硬件领域的最新动态

发表了文章 2024-11-05

Meissonic：高效高分辨率文生图重大革新

Meissonic的新模型，仅1b参数可实现高质量图像生成，能在普通电脑上运行，未来有望支持无线端文本到图像的生成。

发表了文章 2024-11-04

社区供稿 | 创作《哈利波特与异界魔书》的过程和心得

可图Kolors-LoRA风格故事挑战赛一等奖作品，以下是团队创作过程的详细回顾

发表了文章 2024-11-04

聚众炼丹啦！魔搭LoRA挑战赛月度赛来啦！

哐~啷~咣~当~🔈 魔搭社区LoRA创意挑战赛月度赛来啦！

发表了文章 2024-11-01

社区供稿 |【8卡从零训练Steel-LLM】微调探索与评估

本篇文章主要介绍下微调上的探索以及评估。另外，还特意试了试训练CMMLU数据集，能在榜单上提多少分

发表了文章 2024-10-31

实战 | 猫猫、少女、FLUX、ControlNet

魔搭社区集结了来自多个组织的 FLUX ControlNet 模型，魔搭社区的开源项目 DiffSynth-Studio 为这些模型提供了支持，今天就随我们一起，体验一下这些 FLUX ControlNet 模型的神奇生成能力。

发表了文章 2024-10-30

MaskGCT：登上GitHub趋势榜榜首的TTS开源大模型

近日，香港中文大学（深圳）联手趣丸科技推出了新一代大规模声音克隆TTS模型——MaskGCT。一起看看该模型的一些表现吧！

发表了文章 2024-10-29

AI+硬件最新资讯合集（2024-10-28第1期）

AI与硬件的结合正逐步改变我们的生活方式，本期合集将带您了解AI+硬件的最新动态：

发表了文章 2024-10-28

魔搭社区每周速递（10.20-10.26）

4848个模型、45个数据集、46个创新应用、7篇应用文章

发表了文章 2024-10-28

GLM-4-Voice，智谱开源版“Her”来了！

智谱 AI 推出并开源端到端语音模型 GLM-4-Voice！GLM-4-Voice 能够直接理解和生成中英文语音，进行实时语音对话，并且能够遵循用户的指令要求改变语音的情感、语调、语速、方言等属性。

发表了文章 2024-10-25

统一多模态模型来了！智源发布多模态世界模型Emu3！

2024年10月21日，智源研究院正式发布原生多模态世界模型Emu3。

发表了文章 2024-10-24

“今日热点：AI像人类一样使用手机和电脑”，魔搭社区的开源项目已先行一步

今天，Claude发布了Computer Use的新功能，可以让AI像人一样使用电脑！

发表了文章 2024-10-23

Deepseek开源多模态LLM模型框架Janus，魔搭社区最佳实践

deepseek近期推出了简单、统一且灵活的多模态框架Janus，它能够统一处理多模态理解和生成任务。让我们一起来了解一下吧。

发表了文章 2024-10-23

请拥有edu邮箱的同学来领取专（免）属（费）GPU！

300小时免费GPU等你来领！魔搭GPU资源福利社，为你注入动力！

发表了文章 2024-10-22

MemoryScope：为LLM聊天机器人配备的长期记忆系统

如何选择合适的方法构建自己的智能体助理呢？这里向您介绍强大、低延迟、安全可控的MemoryScope开源项目。

发表了文章 2024-10-21

交大x-lance跨媒体语言智能实验室等联合开源F5-TTS！零样本语音复刻，生成流畅，情感丰富！

上海交大x-lance跨媒体语言智能实验室联合剑桥大学、吉利汽车研究院（宁波）公司开源了一种基于流匹配的扩散变换器（Diffusion Transformer，DiT）的完全非自回归TTS模型-F5-TTS。

发表了文章 2024-10-21

魔搭社区每周速递（10.13-10.19）

503个模型、189个数据集、82个创新应用、9篇应用文章

发表了文章 2024-10-21

如何利用 OpenVINO™ 部署 Qwen2 多模态模型

本文将分享如何利用 OpenVINO™ 工具套件在轻薄本上部署 Qwen2-Audio 以及 Qwen2-VL 多模态模型。

发表了文章 2024-10-18

阿里妈妈技术开源FLUX图像修复&蒸馏加速模型

本文介绍了阿里妈妈技术团队基于FLUX开发的Controlnet修复模型和蒸馏加速模型，填补了社区空白并提升了FLUX的实用性和效率。

发表了文章 2024-10-17

ModelScope魔搭10月版本发布月报

ModelScope 10月份整体上新啦！本次更新干货满满，推出了我们在内部开发与灰度许久的全新站点设计，其中也包括开发者反馈已久的暗黑模式支持等一系列功能，希望得到大家的使用反馈。

发表了文章 2024-10-16

TeleAI 开源星辰语义大模型-TeleChat2！

2024.9.20 中国电信人工智能研究院（TeleAI）开源TeleChat2-115B模型，该模型是首个完全国产算力训练并开源的千亿参数模型。

发表了文章 2024-10-15

开源模型+Orchestrating Agents多智能体框架，易用、强大且可控

本文采用开源Qwen2.5-14B-instruct-GGUF来体验多智能体编排和交接，希望在体验多智能体编排和交接框架的同时，一起评估中小参数规模的模型（14B）能否较好的完成多智能体任务。

发表了文章 2024-10-14

魔搭社区每周速递（9.28-10.12）

503个模型、189个数据集、82个创新应用、9篇应用文章

发表了文章 2024-10-14

阿里国际AI开源Ovis1.6，多项得分超GPT-4o-mini！

阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。

发表了文章 2024-10-12

多智能体微调实践：α-UMi 开源

近年来，为了加强大型语言模型(Large-Language Models, LLM）实时信息处理、解决专业问题的能力，催生了工具调用智能体（Tool Integrated Agent）概念

发表了文章 2024-10-12

ExVideo+CogVideoX，更长、更优！再次升级的开源视频生成能力

DiffSynth-Studio 再次为 CogVideoX 带来新的增强模块——ExVideo-CogVideoX-LoRA-129f-v1

发表了文章 2024-10-11

xGPU来啦！免费GPU资源开发花样AI应用！

为了降低AI应用服务和推广的门槛，解决开发者面临的实际痛点，ModelScope社区推出 xGPU 服务，让大家能够免费使用高性能 GPU 资源，托管自己的AI应用服务。

发表了文章 2024-10-09

Ultralytics YOLO11来啦！更快！更强！

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的 Joseph Redmon 和 Ali Farhadi 开发。

发表了文章 2024-10-08

智源研究院开源中文互联网语料库CCI3.0，1000GB数据集，498GB高质量子集，魔搭社区可下载

近日，智源研究院正式发布中文互联网语料库CCI 3.0(Chinese Corpora Internet，简称 CCI)

发表了文章 2024-10-08

LLaMA-Omni 低延迟高质量语音交互，开源！

随着GPT-4o的发布，在语音界面的Voice-Chat越来越受到大家的关注，对于低延迟，高准确性模型的speech-to-speech的需求日益增长

发表了文章 2024-10-08

666条数据，训练LongWriter模型，写万字长文！模型&数据集均开源！

大模型的上下文(Context)支持越来越长的背景下，让通用的大模型遵循指令来保障长文本输出的长度，依然是一个挑战。

发表了文章 2024-10-08

魔搭社区每周速递（9.7-9.27）

182个模型、211个数据集、38个创新应用、6篇应用文章

发表了文章 2024-10-08

近五千支队伍决战AI之巅， AFAC2024金融智能创新大赛在2024 Inclusion · 外滩大会完美收官

自从2022年12月ChatGPT上线以来，全球掀起了一场你追我赶的AI竞赛，不少国家都在全力以赴，抢占制高点。

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

ModelScope内容运营小助手_个人页

个人介绍

擅长的技术

冬天到了，用OmniGen生成一个温暖的拥抱

魔搭社区每周速递（11.10-11.16）

ModelScope魔搭11月版本发布月报

基于开源技术的数字人实时对话：形象可自定义，支持语音输入，对话首包延迟可低至3s

智源行业应用大模型挑战赛开启报名！挖掘数据潜能，共创行业新篇

AI+硬件最新资讯合集（2024-11-11第3期）

Qwen2.5-Coder深夜开源炸场，Prompt编程的时代来了！

Open NotebookLM，一键PDF/URL转播客！

魔搭社区创空间全新支持 Gradio 5

智源研究院发布千万级多模态指令数据集Infinity-MM：驱动开源模型迈向SOTA性能

魔搭社区每周速递（10.27-11.09）

让你的Notebook飞起来！开发体验再上新台阶

上交大、上海人工智能实验室开源首个多轮安全对齐数据集 SafeMTData

AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营

NeurIPS D&B 2024 突破短视频局限！MMBench-Video解读MLLM视频理解能力

打破文本边界：如何进行多模态RAG评估

现在，一行命令使用Ollama运行任意魔搭GGUF模型

AI+硬件最新资讯合集（2024-11-05第2期）

Meissonic：高效高分辨率文生图重大革新

社区供稿 | 创作《哈利波特与异界魔书》的过程和心得

聚众炼丹啦！魔搭LoRA挑战赛月度赛来啦！

社区供稿 |【8卡从零训练Steel-LLM】微调探索与评估

实战 | 猫猫、少女、FLUX、ControlNet

MaskGCT：登上GitHub趋势榜榜首的TTS开源大模型

AI+硬件最新资讯合集（2024-10-28第1期）

魔搭社区每周速递（10.20-10.26）

GLM-4-Voice，智谱开源版“Her”来了！

统一多模态模型来了！智源发布多模态世界模型Emu3！

“今日热点：AI像人类一样使用手机和电脑”，魔搭社区的开源项目已先行一步

Deepseek开源多模态LLM模型框架Janus，魔搭社区最佳实践

请拥有edu邮箱的同学来领取专（免）属（费）GPU！

MemoryScope：为LLM聊天机器人配备的长期记忆系统

交大x-lance跨媒体语言智能实验室等联合开源F5-TTS！零样本语音复刻，生成流畅，情感丰富！

魔搭社区每周速递（10.13-10.19）

如何利用 OpenVINO™ 部署 Qwen2 多模态模型

阿里妈妈技术开源FLUX图像修复&蒸馏加速模型

ModelScope魔搭10月版本发布月报

TeleAI 开源星辰语义大模型-TeleChat2！

开源模型+Orchestrating Agents多智能体框架，易用、强大且可控

魔搭社区每周速递（9.28-10.12）

阿里国际AI开源Ovis1.6，多项得分超GPT-4o-mini！

多智能体微调实践：α-UMi 开源

ExVideo+CogVideoX，更长、更优！再次升级的开源视频生成能力

xGPU来啦！免费GPU资源开发花样AI应用！

Ultralytics YOLO11来啦！更快！更强！

智源研究院开源中文互联网语料库CCI3.0，1000GB数据集，498GB高质量子集，魔搭社区可下载

LLaMA-Omni 低延迟高质量语音交互，开源！

666条数据，训练LongWriter模型，写万字长文！模型&数据集均开源！

魔搭社区每周速递（9.7-9.27）

近五千支队伍决战AI之巅， AFAC2024金融智能创新大赛在2024 Inclusion · 外滩大会完美收官

冬天到了，用OmniGen生成一个温暖的拥抱

魔搭社区每周速递（11.10-11.16）

ModelScope魔搭11月版本发布月报

基于开源技术的数字人实时对话：形象可自定义，支持语音输入，对话首包延迟可低至3s

智源行业应用大模型挑战赛开启报名！挖掘数据潜能，共创行业新篇

AI+硬件最新资讯合集（2024-11-11第3期）

Qwen2.5-Coder深夜开源炸场，Prompt编程的时代来了！

Open NotebookLM，一键PDF/URL转播客！

魔搭社区创空间全新支持 Gradio 5

智源研究院发布千万级多模态指令数据集Infinity-MM：驱动开源模型迈向SOTA性能

魔搭社区每周速递（10.27-11.09）