魔搭社区模型速递(6.8-6.14)

简介: 魔搭ModelScope本期社区进展:1173个模型,143个数据集,76个创新应用,10 篇内容

image.gif 编辑

🙋魔搭ModelScope本期社区进展:

📟1173个模型:Magistral-Small-2506、dots.llm1、MonkeyOCR等;

📁143个数据集:saisdata、OpenThoughts3-1.2M、MMVU等;

🎨76个创新应用:BMMR-Leaderboard-detailed、RedNoob、openaudio-s1-mini等;

📄 10 篇内容:

  • 告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案
  • UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究
  • 支持自主创建MCP啦!一文带你玩转魔搭MCP广场,从idea到部署自己的MCP到魔搭
  • One-to-Normal Anomaly Personalization:少样本异常识别新突破,扩散模型助力精准检测
  • 从种草生活到种草AI,小红书发布首个开源大模型dots.llm1
  • 趣丸千音MCP首发上线魔搭社区,多重技术引擎,解锁AI语音无限可能
  • 想一年不如实实在在干两天 | 52小时创业森林开启报名
  • AgentScope 与 MCP:实践、思考与展望
  • “一丹一世界”三等奖 | 蓝色幻想 经验分享-AIGC商业海报落地
  • 十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!

 

01.模型推荐

Magistral-Small-2506

Magistral-Small-2506是基于Mistral Small 3.1(2503版本)的升级模型,通过融合Magistral Medium轨迹的监督微调(SFT)与强化学习(RL)训练,显著增强推理能力。这款高效的小型推理模型参数量达240亿,量化后可在单张RTX 4090显卡或32GB内存的MacBook本地部署。

 

Magistral-Small-2506具备长推理链能力,支持英语、法语、中文等数十种语言,采用Apache 2.0开源许可(允许商业及非商业使用)。其128k上下文窗口实际建议设为40k,超过此范围性能可能下降。

模型链接:

https://modelscope.cn/models/mistralai/Magistral-Small-2506

 

示例代码:

推荐使用vLLM,按如下方式启动模型:

VLLM_USE_MODELSCOPE=true vllm serve mistralai/Magistral-Small-2506 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 2

image.gif

 

dots.llm1

dots.llm1 模型是小红书Hi lab团队(Humane Intelligence Lab)推出的一个大规模的 MoE 模型,从总共 142B 参数中激活了 14B 参数,性能与当前最先进的开源模型相当。 通过rednote-hilab研究团队精心设计和高效的数据处理流水线,dots.llm1 在没有合成数据的情况下,在高质量语料库上预训练后,达到了与 Qwen2.5-72B 相当的性能。为了进一步促进研究,研究团队开源了整个训练过程中的中间训练Checkpoint,并提供了对大型语言模型学习动态的宝贵见解。

模型链接:

https://modelscope.cn/organization/rednote-hilab

 

示例代码:

推荐使用Docker 进行模型推理,Docker 镜像可在 Docker Hub(https://hub.docker.com/repository/docker/rednotehilab/dots1/tags) 上找到。

 

可以通过 vllm 启动一个服务器

docker run --gpus all \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    -p 8000:8000 \
    --ipc=host \
    rednotehilab/dots1:vllm-openai-v0.9.0.1 \
    --model rednote-hilab/dots.llm1.inst \
    --tensor-parallel-size 8 \
    --trust-remote-code \
    --served-model-name dots1

image.gif

然后可以通过以下方式验证模型是否成功运行

curl http://localhost:8000/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
        "model": "dots1",
        "messages": [
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "Who won the world series in 2020?"}
        ],
        "max_tokens": 32,
        "temperature": 0
    }'

image.gif

更多推理实战教程详见:

从种草生活到种草AI,小红书发布首个开源大模型dots.llm1

MonkeyOCR

MonkeyOCR是由华中科技大学联合金山办公推出的一款文档解析模型,具备高精度和强泛化能力。该模型支持多语言、多场景的文字检测与识别,适用于文档数字化、内容审核、信息提取等多种应用场合。与传统方法相比,MonkeyOCR在处理复杂文档时,平均性能提升5.1%,在公式和表格解析上分别提升15%、8.6%。

模型链接:

https://modelscope.cn/models/AI-ModelScope/MonkeyOCR

示例代码:

安装 MonkeyOCR

conda create -n MonkeyOCR python=3.10conda activate MonkeyOCRgit clone https://github.com/Yuliang-Liu/MonkeyOCR.gitcd MonkeyOCR# Install pytorch, see https://pytorch.org/get-started/previous-versions/ for your cuda versionpip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu124 pip install -e .

image.gif

下载模型权重

pip install modelscope
python tools/download_model.py -t modelscope

image.gif

推理

# Make sure in MonkeyOCR directory
python parse.py path/to/your.pdf
# or with image as input
pyhton parse.py path/to/your/image
# Specify output path and model configs path
python parse.py path/to/your.pdf -o ./output -c config.yaml

image.gif

02.数据集推荐

Saisdata

 

saisdata是一款面向特定领域应用的高质量文本数据集,适用于自然语言处理、文本分类等相关任务的研究与开发。该数据集包含丰富的文本内容及相应标注信息,能够有效支持模型训练、评估与优化等环节。作为开放共享的数据资源,saisdata致力于为算法研发和实际应用提供坚实的数据支撑。

数据集链接:

 

https://modelscope.cn/datasets/wpixiu/saisdata

 

 

OpenThoughts3-1.2M

OpenThoughts3-1.2M是大型中文多任务指令数据集,包含超过120万条高质量的指令与响应对,覆盖多种自然语言处理任务。该数据集旨在推动大模型在中文场景下的多任务学习与泛化能力研究,适用于模型训练、评估及微调等应用场景。

 

数据集链接:

https://modelscope.cn/datasets/open-thoughts/OpenThoughts3-1.2M

 

 

MMVU

MMVU是多模态视频理解评估数据集,专注于测试和提升模型在视频内容理解、跨模态推理等方面的能力。该数据集包含丰富的真实场景视频样本及多维度标注信息,覆盖多种复杂语义理解和推理任务。

数据集链接:

https://modelscope.cn/datasets/AI-ModelScope/MMVU

 

03.创空间

BMMR-Leaderboard-detailed

用于呈现多模态检索(如图文检索、视频检索等)任务中各类模型的性能排名与详细评测结果。基于BMMR(Benchmark for Multimodal Retrieval)评测体系,提供了全面、客观的模型对比数据。

体验链接:

https://modelscope.cn/studios/guanyuli615/BMMR-Leaderboard-detailed

 

RedNoob

输入笔记的标题和内容,模型将预测其受欢迎程度分数 (WLAES)。

 

体验链接:

https://modelscope.cn/studios/Hamiglet/RedNoob

 

openaudio-s1-mini

OpenAudio-S1-Mini是一款轻量级音频理解模型,支持多种音频任务如语音识别、语种检测和关键词提取,适用于资源受限场景下的高效部署。

 

体验链接:

https://modelscope.cn/studios/Hamiglet/RedNoob

 

04.社区精选文章

告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案

UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究

支持自主创建MCP啦!一文带你玩转魔搭MCP广场,从idea到部署自己的MCP到魔搭

One-to-Normal Anomaly Personalization:少样本异常识别新突破,扩散模型助力精准检测

从种草生活到种草AI,小红书发布首个开源大模型dots.llm1

“一丹一世界”三等奖 | 蓝色幻想 经验分享-AIGC商业海报落地

趣丸千音MCP首发上线魔搭社区,多重技术引擎,解锁AI语音无限可能

想一年不如实实在在干两天 | 52小时创业森林开启报名

AgentScope 与 MCP:实践、思考与展望

十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!

 

 


目录
相关文章
|
Kubernetes 安全 Devops
【云效流水线 Flow 测评】驾驭云海:五大场景下的云效Flow实战部署评测
云效是一款企业级持续集成和持续交付工具,提供免费、高可用的服务,集成阿里云多种服务,支持蓝绿、分批、金丝雀等发布策略。其亮点包括快速定位问题、节省维护成本、丰富的企业级特性及与团队协作的契合。基础版和高级版分别针对小型企业和大规模团队,提供不同功能和服务。此外,云效对比Jenkins在集成阿里云服务和易用性上有优势。通过实战演示了云效在ECS和K8s上的快速部署流程,以及代码质量检测和AI智能排查功能,展示了其在DevOps流程中的高效和便捷,适合不同规模的企业使用。本文撰写用时5小时,请各位看官帮忙多多支持,如有建议也请一并给出,您的建议能帮助我下一篇更加出色。
219272 19
|
21天前
|
机器学习/深度学习 测试技术 API
Qwen3.5 中等规模模型系列正式开源:更强智能,更低算力
通义千问Qwen3.5发布四款中等规模多模态模型,支持256K原生上下文(可扩至1M)、201种语言及统一视觉语言训练。凭借Gated Delta+MoE混合架构与百万Agent强化学习,35B-A3B仅激活3B参数即超越旧旗舰,性能、效率与部署成本兼具。(239字)
3640 23
|
9月前
|
人工智能 JSON 文字识别
AI新宠DocExt:纯本地文档抽取,开源免费还无依赖!你还在为OCR头疼吗?
DocExt 是一款开源、免费的本地文档结构化提取工具,无需依赖 OCR 或云端服务,通过视觉语言模型(VLM)实现票据、护照、发票等多类型文档的关键字段与表格识别。支持多页文档处理、置信度量化及本地部署,提供直观的 Gradio Web 界面和灵活的 API 调用方式,适配高隐私场景如金融、医疗等领域。项目参与 IDP Leaderboard 评测,具备零模板限制和多模型支持等优势,是处理敏感文件的理想选择。
2263 0
|
9月前
|
数据采集 人工智能 编解码
2025年颠覆闭源大模型?MonkeyOCR:这款开源AI文档解析模型,精度更高,速度更快!
还在依赖昂贵且慢的闭源OCR工具?华中科技大学开源的MonkeyOCR文档解析模型,以其超越GPT4o的精度和更快的推理速度,在单机单卡(3090)上即可部署,正颠覆业界认知。本文将深入解析其设计哲学、核心突破——大规模自建数据集,并分享实测体验与避坑指南。
2288 87
|
4月前
|
人工智能 物联网 测试技术
Qwen-Image-Edit:全能图像编辑,驱动内容创作提质增效
通义千问团队开源Qwen-Image-Edit,基于20B模型,支持语义与外观双重编辑、精准中英文文字修改,具备SOTA图像编辑能力,可用于IP创作、风格迁移、文字修复等。
3623 6
|
8月前
|
编解码 物联网 开发者
FLUX.1 Kontext 的全生态教程来啦!AIGC专区在线试玩!
Flux.1 Kontext [dev] 开源模型大家都用上了吗?小编汇总了3个使用教程,打包送上!
3141 1
|
9月前
|
人工智能 安全 算法
十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!
近日,国家数据局举办了2025“数据要素×”首场新闻发布会。
365 9
十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!
|
3月前
|
IDE 开发工具 C++
Python 初学者常见 10 大误区与避坑指南
本文总结Python初学者易犯的10大编码误区,如缩进错误、混淆“==”与“is”、修改迭代列表等,结合典型案例解析原因并提供实用解决方案,帮助新手规避常见陷阱,建立正确的Python编程思维,提升代码质量与可读性。
|
3月前
|
存储 NoSQL 关系型数据库
Python 持久层开发:从文件到数据库的实践指南
Python持久层开发覆盖全场景需求,从轻量文件(TXT/CSV/JSON)到关系型数据库(SQLite/MySQL/PostgreSQL),再到非关系型数据库(MongoDB/Redis),结合ORM工具,按需选型可实现高效、可靠的数据存储与访问,适配从小工具到企业级系统的各类应用。
|
机器学习/深度学习 存储 文字识别
OCR -- 文本识别 -- 实践篇
OCR -- 文本识别 -- 实践篇
823 1

热门文章

最新文章