编辑
🙋魔搭ModelScope本期社区进展:
📟1173个模型:Magistral-Small-2506、dots.llm1、MonkeyOCR等;
📁143个数据集:saisdata、OpenThoughts3-1.2M、MMVU等;
🎨76个创新应用:BMMR-Leaderboard-detailed、RedNoob、openaudio-s1-mini等;
📄 10 篇内容:
- 告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案
- UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究
- 支持自主创建MCP啦!一文带你玩转魔搭MCP广场,从idea到部署自己的MCP到魔搭
- One-to-Normal Anomaly Personalization:少样本异常识别新突破,扩散模型助力精准检测
- 从种草生活到种草AI,小红书发布首个开源大模型dots.llm1
- 趣丸千音MCP首发上线魔搭社区,多重技术引擎,解锁AI语音无限可能
- 想一年不如实实在在干两天 | 52小时创业森林开启报名
- AgentScope 与 MCP:实践、思考与展望
- “一丹一世界”三等奖 | 蓝色幻想 经验分享-AIGC商业海报落地
- 十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!
01.模型推荐
Magistral-Small-2506
Magistral-Small-2506是基于Mistral Small 3.1(2503版本)的升级模型,通过融合Magistral Medium轨迹的监督微调(SFT)与强化学习(RL)训练,显著增强推理能力。这款高效的小型推理模型参数量达240亿,量化后可在单张RTX 4090显卡或32GB内存的MacBook本地部署。
Magistral-Small-2506具备长推理链能力,支持英语、法语、中文等数十种语言,采用Apache 2.0开源许可(允许商业及非商业使用)。其128k上下文窗口实际建议设为40k,超过此范围性能可能下降。
模型链接:
https://modelscope.cn/models/mistralai/Magistral-Small-2506
示例代码:
推荐使用vLLM,按如下方式启动模型:
VLLM_USE_MODELSCOPE=true vllm serve mistralai/Magistral-Small-2506 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 2
dots.llm1
dots.llm1 模型是小红书Hi lab团队(Humane Intelligence Lab)推出的一个大规模的 MoE 模型,从总共 142B 参数中激活了 14B 参数,性能与当前最先进的开源模型相当。 通过rednote-hilab研究团队精心设计和高效的数据处理流水线,dots.llm1 在没有合成数据的情况下,在高质量语料库上预训练后,达到了与 Qwen2.5-72B 相当的性能。为了进一步促进研究,研究团队开源了整个训练过程中的中间训练Checkpoint,并提供了对大型语言模型学习动态的宝贵见解。
模型链接:
https://modelscope.cn/organization/rednote-hilab
示例代码:
推荐使用Docker 进行模型推理,Docker 镜像可在 Docker Hub(https://hub.docker.com/repository/docker/rednotehilab/dots1/tags) 上找到。
可以通过 vllm 启动一个服务器
docker run --gpus all \ -v ~/.cache/huggingface:/root/.cache/huggingface \ -p 8000:8000 \ --ipc=host \ rednotehilab/dots1:vllm-openai-v0.9.0.1 \ --model rednote-hilab/dots.llm1.inst \ --tensor-parallel-size 8 \ --trust-remote-code \ --served-model-name dots1
然后可以通过以下方式验证模型是否成功运行
curl http://localhost:8000/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "dots1", "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "Who won the world series in 2020?"} ], "max_tokens": 32, "temperature": 0 }'
更多推理实战教程详见:
从种草生活到种草AI,小红书发布首个开源大模型dots.llm1
MonkeyOCR
MonkeyOCR是由华中科技大学联合金山办公推出的一款文档解析模型,具备高精度和强泛化能力。该模型支持多语言、多场景的文字检测与识别,适用于文档数字化、内容审核、信息提取等多种应用场合。与传统方法相比,MonkeyOCR在处理复杂文档时,平均性能提升5.1%,在公式和表格解析上分别提升15%、8.6%。
模型链接:
https://modelscope.cn/models/AI-ModelScope/MonkeyOCR
示例代码:
安装 MonkeyOCR
conda create -n MonkeyOCR python=3.10conda activate MonkeyOCRgit clone https://github.com/Yuliang-Liu/MonkeyOCR.gitcd MonkeyOCR# Install pytorch, see https://pytorch.org/get-started/previous-versions/ for your cuda versionpip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu124 pip install -e .
下载模型权重
pip install modelscope python tools/download_model.py -t modelscope
推理
# Make sure in MonkeyOCR directory python parse.py path/to/your.pdf # or with image as input pyhton parse.py path/to/your/image # Specify output path and model configs path python parse.py path/to/your.pdf -o ./output -c config.yaml
02.数据集推荐
Saisdata
saisdata是一款面向特定领域应用的高质量文本数据集,适用于自然语言处理、文本分类等相关任务的研究与开发。该数据集包含丰富的文本内容及相应标注信息,能够有效支持模型训练、评估与优化等环节。作为开放共享的数据资源,saisdata致力于为算法研发和实际应用提供坚实的数据支撑。
数据集链接:
https://modelscope.cn/datasets/wpixiu/saisdata
OpenThoughts3-1.2M
OpenThoughts3-1.2M是大型中文多任务指令数据集,包含超过120万条高质量的指令与响应对,覆盖多种自然语言处理任务。该数据集旨在推动大模型在中文场景下的多任务学习与泛化能力研究,适用于模型训练、评估及微调等应用场景。
数据集链接:
https://modelscope.cn/datasets/open-thoughts/OpenThoughts3-1.2M
MMVU
MMVU是多模态视频理解评估数据集,专注于测试和提升模型在视频内容理解、跨模态推理等方面的能力。该数据集包含丰富的真实场景视频样本及多维度标注信息,覆盖多种复杂语义理解和推理任务。
数据集链接:
https://modelscope.cn/datasets/AI-ModelScope/MMVU
03.创空间
BMMR-Leaderboard-detailed
用于呈现多模态检索(如图文检索、视频检索等)任务中各类模型的性能排名与详细评测结果。基于BMMR(Benchmark for Multimodal Retrieval)评测体系,提供了全面、客观的模型对比数据。
体验链接:
https://modelscope.cn/studios/guanyuli615/BMMR-Leaderboard-detailed
RedNoob
输入笔记的标题和内容,模型将预测其受欢迎程度分数 (WLAES)。
体验链接:
https://modelscope.cn/studios/Hamiglet/RedNoob
openaudio-s1-mini
OpenAudio-S1-Mini是一款轻量级音频理解模型,支持多种音频任务如语音识别、语种检测和关键词提取,适用于资源受限场景下的高效部署。
体验链接:
https://modelscope.cn/studios/Hamiglet/RedNoob
04.社区精选文章
告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案
UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究
支持自主创建MCP啦!一文带你玩转魔搭MCP广场,从idea到部署自己的MCP到魔搭
One-to-Normal Anomaly Personalization:少样本异常识别新突破,扩散模型助力精准检测
从种草生活到种草AI,小红书发布首个开源大模型dots.llm1
“一丹一世界”三等奖 | 蓝色幻想 经验分享-AIGC商业海报落地
趣丸千音MCP首发上线魔搭社区,多重技术引擎,解锁AI语音无限可能