魔搭社区模型速递(6.8-6.14)

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 魔搭ModelScope本期社区进展:1173个模型,143个数据集,76个创新应用,10 篇内容

image.gif 编辑

🙋魔搭ModelScope本期社区进展:

📟1173个模型:Magistral-Small-2506、dots.llm1、MonkeyOCR等;

📁143个数据集:saisdata、OpenThoughts3-1.2M、MMVU等;

🎨76个创新应用:BMMR-Leaderboard-detailed、RedNoob、openaudio-s1-mini等;

📄 10 篇内容:

  • 告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案
  • UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究
  • 支持自主创建MCP啦!一文带你玩转魔搭MCP广场,从idea到部署自己的MCP到魔搭
  • One-to-Normal Anomaly Personalization:少样本异常识别新突破,扩散模型助力精准检测
  • 从种草生活到种草AI,小红书发布首个开源大模型dots.llm1
  • 趣丸千音MCP首发上线魔搭社区,多重技术引擎,解锁AI语音无限可能
  • 想一年不如实实在在干两天 | 52小时创业森林开启报名
  • AgentScope 与 MCP:实践、思考与展望
  • “一丹一世界”三等奖 | 蓝色幻想 经验分享-AIGC商业海报落地
  • 十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!

 

01.模型推荐

Magistral-Small-2506

Magistral-Small-2506是基于Mistral Small 3.1(2503版本)的升级模型,通过融合Magistral Medium轨迹的监督微调(SFT)与强化学习(RL)训练,显著增强推理能力。这款高效的小型推理模型参数量达240亿,量化后可在单张RTX 4090显卡或32GB内存的MacBook本地部署。

 

Magistral-Small-2506具备长推理链能力,支持英语、法语、中文等数十种语言,采用Apache 2.0开源许可(允许商业及非商业使用)。其128k上下文窗口实际建议设为40k,超过此范围性能可能下降。

模型链接:

https://modelscope.cn/models/mistralai/Magistral-Small-2506

 

示例代码:

推荐使用vLLM,按如下方式启动模型:

VLLM_USE_MODELSCOPE=true vllm serve mistralai/Magistral-Small-2506 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 2

image.gif

 

dots.llm1

dots.llm1 模型是小红书Hi lab团队(Humane Intelligence Lab)推出的一个大规模的 MoE 模型,从总共 142B 参数中激活了 14B 参数,性能与当前最先进的开源模型相当。 通过rednote-hilab研究团队精心设计和高效的数据处理流水线,dots.llm1 在没有合成数据的情况下,在高质量语料库上预训练后,达到了与 Qwen2.5-72B 相当的性能。为了进一步促进研究,研究团队开源了整个训练过程中的中间训练Checkpoint,并提供了对大型语言模型学习动态的宝贵见解。

模型链接:

https://modelscope.cn/organization/rednote-hilab

 

示例代码:

推荐使用Docker 进行模型推理,Docker 镜像可在 Docker Hub(https://hub.docker.com/repository/docker/rednotehilab/dots1/tags) 上找到。

 

可以通过 vllm 启动一个服务器

docker run --gpus all \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    -p 8000:8000 \
    --ipc=host \
    rednotehilab/dots1:vllm-openai-v0.9.0.1 \
    --model rednote-hilab/dots.llm1.inst \
    --tensor-parallel-size 8 \
    --trust-remote-code \
    --served-model-name dots1

image.gif

然后可以通过以下方式验证模型是否成功运行

curl http://localhost:8000/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
        "model": "dots1",
        "messages": [
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "Who won the world series in 2020?"}
        ],
        "max_tokens": 32,
        "temperature": 0
    }'

image.gif

更多推理实战教程详见:

从种草生活到种草AI,小红书发布首个开源大模型dots.llm1

MonkeyOCR

MonkeyOCR是由华中科技大学联合金山办公推出的一款文档解析模型,具备高精度和强泛化能力。该模型支持多语言、多场景的文字检测与识别,适用于文档数字化、内容审核、信息提取等多种应用场合。与传统方法相比,MonkeyOCR在处理复杂文档时,平均性能提升5.1%,在公式和表格解析上分别提升15%、8.6%。

模型链接:

https://modelscope.cn/models/AI-ModelScope/MonkeyOCR

示例代码:

安装 MonkeyOCR

conda create -n MonkeyOCR python=3.10conda activate MonkeyOCRgit clone https://github.com/Yuliang-Liu/MonkeyOCR.gitcd MonkeyOCR# Install pytorch, see https://pytorch.org/get-started/previous-versions/ for your cuda versionpip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu124 pip install -e .

image.gif

下载模型权重

pip install modelscope
python tools/download_model.py -t modelscope

image.gif

推理

# Make sure in MonkeyOCR directory
python parse.py path/to/your.pdf
# or with image as input
pyhton parse.py path/to/your/image
# Specify output path and model configs path
python parse.py path/to/your.pdf -o ./output -c config.yaml

image.gif

02.数据集推荐

Saisdata

 

saisdata是一款面向特定领域应用的高质量文本数据集,适用于自然语言处理、文本分类等相关任务的研究与开发。该数据集包含丰富的文本内容及相应标注信息,能够有效支持模型训练、评估与优化等环节。作为开放共享的数据资源,saisdata致力于为算法研发和实际应用提供坚实的数据支撑。

数据集链接:

 

https://modelscope.cn/datasets/wpixiu/saisdata

 

 

OpenThoughts3-1.2M

OpenThoughts3-1.2M是大型中文多任务指令数据集,包含超过120万条高质量的指令与响应对,覆盖多种自然语言处理任务。该数据集旨在推动大模型在中文场景下的多任务学习与泛化能力研究,适用于模型训练、评估及微调等应用场景。

 

数据集链接:

https://modelscope.cn/datasets/open-thoughts/OpenThoughts3-1.2M

 

 

MMVU

MMVU是多模态视频理解评估数据集,专注于测试和提升模型在视频内容理解、跨模态推理等方面的能力。该数据集包含丰富的真实场景视频样本及多维度标注信息,覆盖多种复杂语义理解和推理任务。

数据集链接:

https://modelscope.cn/datasets/AI-ModelScope/MMVU

 

03.创空间

BMMR-Leaderboard-detailed

用于呈现多模态检索(如图文检索、视频检索等)任务中各类模型的性能排名与详细评测结果。基于BMMR(Benchmark for Multimodal Retrieval)评测体系,提供了全面、客观的模型对比数据。

体验链接:

https://modelscope.cn/studios/guanyuli615/BMMR-Leaderboard-detailed

 

RedNoob

输入笔记的标题和内容,模型将预测其受欢迎程度分数 (WLAES)。

 

体验链接:

https://modelscope.cn/studios/Hamiglet/RedNoob

 

openaudio-s1-mini

OpenAudio-S1-Mini是一款轻量级音频理解模型,支持多种音频任务如语音识别、语种检测和关键词提取,适用于资源受限场景下的高效部署。

 

体验链接:

https://modelscope.cn/studios/Hamiglet/RedNoob

 

04.社区精选文章

告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案

UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究

支持自主创建MCP啦!一文带你玩转魔搭MCP广场,从idea到部署自己的MCP到魔搭

One-to-Normal Anomaly Personalization:少样本异常识别新突破,扩散模型助力精准检测

从种草生活到种草AI,小红书发布首个开源大模型dots.llm1

“一丹一世界”三等奖 | 蓝色幻想 经验分享-AIGC商业海报落地

趣丸千音MCP首发上线魔搭社区,多重技术引擎,解锁AI语音无限可能

想一年不如实实在在干两天 | 52小时创业森林开启报名

AgentScope 与 MCP:实践、思考与展望

十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!

 

 


目录
相关文章
|
1月前
|
开发框架 定位技术 API
AgentScope 与 MCP:实践、思考与展望
AgentScope 作为一款功能强大的开源多智能体开发框架,为开发者提供了智能体构建、工具使用、多智能体编排等全方位支持。
295 37
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
魔搭社区模型速递(4.20-4.26)
魔搭ModelScope本期社区进展:2227个模型,270个数据集,167个创新应用,10篇内容
202 4
|
1月前
|
机器学习/深度学习 数据采集 自然语言处理
魔搭社区模型速递(6.2-6.7)
魔搭ModelScope本期社区进展:1910个模型,183个数据集,47个创新应用,5 篇内容
141 11
魔搭社区模型速递(6.2-6.7)
|
1月前
|
人工智能 安全 算法
十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!
近日,国家数据局举办了2025“数据要素×”首场新闻发布会。
115 9
十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!
|
1月前
|
机器学习/深度学习 编解码 文字识别
小米又放大招!MiMo-VL 多模态大模型开源,魔搭推理微调全面解读来了!
今天,小米开源发布两款 7B 规模视觉-语言模型 MiMo-VL-7B-SFT 和 MiMo-VL-7B-RL。
308 9
|
12天前
|
编解码 物联网 开发者
FLUX.1 Kontext 的全生态教程来啦!AIGC专区在线试玩!
Flux.1 Kontext [dev] 开源模型大家都用上了吗?小编汇总了3个使用教程,打包送上!
603 1
Java8 异步非阻塞做法:CompletableFuture 两万字详解
CompletableFuture实现了CompletionStage接口和Future接口,前者是对后者的一个扩展,增加了异步回调、流式处理、多个Future组合处理的能力,使Java在处理多任务的协同工作时更加顺畅便利
|
存储 缓存 Java
Android 百度语音合成 (含离线、在线、API合成方式,详细步骤+源码)
Android 百度语音合成 (含离线、在线、API合成方式,详细步骤+源码)
789 0
Android 百度语音合成 (含离线、在线、API合成方式,详细步骤+源码)
|
存储 人工智能 数据挖掘
使用GGML和LangChain在CPU上运行量化的llama2
Meta AI 在本周二发布了最新一代开源大模型 Llama 2。对比于今年 2 月发布的 Llama 1,训练所用的 token 翻了一倍,已经达到了 2 万亿,对于使用大模型最重要的上下文长度限制,Llama 2 也翻了一倍。
984 1
使用GGML和LangChain在CPU上运行量化的llama2
|
机器学习/深度学习 异构计算 Python
Bert-vits2最终版Bert-vits2-2.3云端训练和推理(Colab免费GPU算力平台)
对于深度学习初学者来说,JupyterNoteBook的脚本运行形式显然更加友好,依托Python语言的跨平台特性,JupyterNoteBook既可以在本地线下环境运行,也可以在线上服务器上运行。GoogleColab作为免费GPU算力平台的执牛耳者,更是让JupyterNoteBook的脚本运行形式如虎添翼。 本次我们利用Bert-vits2的最终版Bert-vits2-v2.3和JupyterNoteBook的脚本来复刻生化危机6的人气角色艾达王(ada wong)。
Bert-vits2最终版Bert-vits2-2.3云端训练和推理(Colab免费GPU算力平台)

热门文章

最新文章