本月上新
ModelScope 10月份整体上新啦!本次更新干货满满,推出了我们在内部开发与灰度许久的全新站点设计,其中也包括开发者反馈已久的暗黑模式支持等一系列功能,希望得到大家的使用反馈。除此之外,还包括了诸多新特性与丰富的功能,通过社区持续的迭代,为广大开发者带来更流畅的围绕模型的AI分享和开发体验!
站点更新
1. ModelScope全新站点改版:旨在为用户提供更加直观和舒适的交互界面,并增加了暗黑模式,提供更加开发者友好的浏览体验。(欢迎参与我们的新版视觉用户调研,期待听到你们的宝贵意见!)
新支持亮、暗界面模式,在右上角进行选择~
2. 合集(Collection)板块:新增合集功能,让开发者更轻松地探索社区内容的自由关联与组合,目前支持将模型、数据集、创空间作为合集元素。
3. Notebook(GPU与CPU)免费持久化存储功能:
为了让开发者享受到可持续的AI开发体验,我们完善了Notebook环境的数据管理能力,让开发者无需再为数据的保存问题所困扰。当前持久化存储功能已在PAI-DSW实例上实现,通过"/mnt/data/"目录提供。
4.SwingDeploy模型列表扩展:通过SwingDeploy提供的OpenAI API兼容模型服务部署,除了支持平台验证过的一些头部模型以外,当前覆盖面全面延展到支持所有ModelScope上的GGUF格式LLM模型。
5. 数据集卡片智能翻译:英文内容的自动翻译,在除了模型卡片以外,本期添加了对数据集卡片描述的自动翻译支持。
6. 模型关联创空间:基于ModelScope模型开发的创空间,自动关联对应模型,方便大家更好了解模型的开发生态。
7. 创空间支持PR:创空间支持通过Pull Request提交修改,使应用开发者能够通过各自的贡献,共同完善社区AI应用
8. 移动端支持文件浏览:在移动设备上,现在可以方便地浏览模型和数据集的文件内容,让用户在端侧更快捷地获取相关社区资源内容信息。
· 开源SDK与工具链更新
1. ModelScope SDK 1.9版本发布
a. ModelScope命令行工具添加clear-cache选项,用于清除本地缓存,具体参见文档中心相关介绍。
b. ModelScope数据集适配了datasets最新的3.0大版本,并统一了dataset下载进度展示,同时完善了对于数据preview的支持。
c. 通过AutoConfig,AutoTokenizer等类进行加载时,跳过模型ckpt下载。
d. 添加了对大模型Template以及Ollama Modelfile自动导出的支持,支持通过Model Id迅速获取模型Template以及Ollama Modelfile
from modelscope.preprocessors.templates import TemplateType from modelscope.preprocessors.templates.loader import TemplateLoader template = TemplateLoader.load_by_model_id('deepseek-ai/DeepSeek-V2-Lite-Chat') print(f"Template Type is: {template.template_type} \n") ollama_modelfile = TemplateLoader.to_ollama('Qwen/Qwen2.5-7B-Instruct') print(f"Modelfile for Ollama:\n{ollama_modelfile} \n")
Template Type is: deepseek2 Modelfile for Ollama: FROM {gguf_file} # set the temperature to 0.7 [higher is more creative, lower is more coherent] PARAMETER temperature 0.7 PARAMETER top_p 0.8 PARAMETER repeat_penalty 1.05 PARAMETER stop "<|im_start|>" PARAMETER stop "<|im_end|>" TEMPLATE """{{ if .Messages }} {{- if or .System .Tools }}<|im_start|>system {{ .System }} {{- if .Tools }} ...
2. SWIFT训练框架2.5版本发布
a. 支持了多模态大模型训练微调后进行GPTQ和AWQ的量化
b. 在ViT部分支持动态的gradient_checkpointing,优化显存使用
c. 添加多模态大模型的预训练
3. EvalScope 0.5.5版本发布
a. 支持LongBench-Write长文本生成的质量评测
b. 建设RAG评测功能,添加embeddings/rerank等模型评测,集成MTEB与CMTEB,并通过集成ragas支持RAG全链路的评测
c. 添加MMBench-Video,Video-MME,MVBench视频评测支持,完善多模态评测能力。