零一万物Yi-1.5系列模型发布并开源!34B/9B/6B 多尺寸魔搭社区推理微调最佳实践教程来啦!

简介: Yi-1.5是Yi的升级版本。 它使用 500B tokens的高质量语料库在 Yi 上持续进行预训练,并在 3M 个多样化的微调样本上进行微调。

一、导读

Yi-1.5是Yi的升级版本。 它使用 500B tokens的高质量语料库在 Yi 上持续进行预训练,并在 3M 个多样化的微调样本上进行微调。

image.png

与 Yi 相比,Yi-1.5 在编码、数学、推理和指令跟踪能力方面表现更强,同时在语言理解、常识推理和阅读理解方面仍然保持出色的能力。

Model

Context Length

Pre-trained Tokens

Yi-1.5

4K

3.6T

模型

  • 对话模型
  • 基础模型

模型评测

  • 对话模型

Yi-1.5-34B-Chat 在多数基准测试中表现与更大规模的模型相当甚至超越它们。

Yi-1.5-9B-Chat 是同规模的开源模型中表现顶尖。

  • 基础模型

Yi-1.5-34B 在多数基准测试中表现与更大规模的模型相当甚至超越它们。

Yi-1.5-9B 是同规模的开源模型中表现顶尖。

以下为大家带来魔搭社区推理、微调最佳实践教程。

二、模型体验

模型体验链接:https://modelscope.cn/studios/01ai/Yi-1.5-34B-Chat-Demo/summary

自我认知:

数学:

逻辑:

三、环境配置与安装

本文使用的模型为Yi-1.5-6B-Chat模型,在ModelScope的Notebook的环境(这里以PAI-DSW为例)的配置下运行(显存24G) 。

环境配置与安装

本文主要演示的模型推理代码可在魔搭社区免费实例PAI-DSW的配置下运行(显存24G) :

点击模型右侧Notebook快速开发按钮,选择GPU环境

打开Notebook环境

四、 模型链接和下载

Yi-9B现已在ModelScope社区开源,模型链接:

https://www.modelscope.cn/models/01ai/Yi-9B/summary

社区支持直接下载模型的repo:

from modelscope import snapshot_download
model_dir = snapshot_download("01ai/Yi-1.5-6B-Chat")

五、Yi-1.5系列模型推理

模型推理

from modelscope import AutoModelForCausalLM, AutoTokenizer,snapshot_download
import torch
model_dir = snapshot_download('01ai/Yi-1.5-6B-Chat')
tokenizer = AutoTokenizer.from_pretrained(model_dir, use_fast=False)
# Since transformers 4.35.0, the GPT-Q/AWQ model can be loaded using AutoModelForCausalLM.
model = AutoModelForCausalLM.from_pretrained(
    model_dir,
    device_map="auto",
    torch_dtype=torch.bfloat16
).eval()
# Prompt content: "hi"
messages = [
    {"role": "user", "content": "浙江的省会是哪里?"}
]
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors='pt')
output_ids = model.generate(input_ids.to('cuda'))
response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
# Model response: "Hello! How can I assist you today?"
print(response)

显存占用:

六、Yi-1.5系列模型微调和微调后推理

我们使用swift来对模型进行微调, swift是魔搭社区官方提供的LLM微调推理框架.

微调代码开源地址: https://github.com/modelscope/swift

以yi-1.5-9b-chat模型为例,我们使用swift提供的自我认知数据集进行训练, 改变模型对自己和作者的认知。目前魔搭社区已经支持了yi1.5-6B/9B/34B全系列模型(包含量化模型)的训练和推理。请点击链接来查看具体支持的模型类型:https://github.com/modelscope/swift/blob/main/docs/source/LLM/%E6%94%AF%E6%8C%81%E7%9A%84%E6%A8%A1%E5%9E%8B%E5%92%8C%E6%95%B0%E6%8D%AE%E9%9B%86.md

环境准备:

git clone https://github.com/modelscope/swift.git
cd swift
pip install .[llm]

微调脚本: LoRA

# Experimental environment: A100
# 19GB GPU memory
swift sft \
    --model_type yi-1_5-9b-chat \
    --sft_type lora \
    --dataset self-cognition#1000 \
    --dtype AUTO \
    --num_train_epochs 1 \
    --max_length 1024 \
    --check_dataset_strategy warning \
    --lora_rank 8 \
    --lora_alpha 32 \
    --lora_dropout_p 0.05 \
    --lora_target_modules ALL \
    --gradient_checkpointing true \
    --batch_size 1 \
    --weight_decay 0.1 \
    --learning_rate 1e-4 \
    --gradient_accumulation_steps 16 \
    --max_grad_norm 0.5 \
    --warmup_ratio 0.03 \
    --save_total_limit 2 \
    --logging_steps 10 \
    --use_flash_attn true \
    --model_name 小白 'Xiao Bai' \
    --model_author 魔搭 ModelScope \

微调后推理脚本: (这里的ckpt_dir需要修改为训练生成的checkpoint文件夹)

# Experimental environment: A100
CUDA_VISIBLE_DEVICES=0 \
swift infer \
    --ckpt_dir "output/yi-1_5-9b-chat/vx-xxx/checkpoint-xxx" \
    --use_flash_attn true \
    --temperature 0.3 \
    --top_p 0.7 \
    --repetition_penalty 1. \
    --do_sample true \
    --merge_lora false

微调的可视化结果:

训练前生成样例:

训练后生成样例:

(微调后通用能力测试)

资源占用

微调

七、Yi-1.5系列模型量化方法

社区开发者基于AWQ和GPTQ的方法,对Yi-1.5系列模型量化,量化后的模型已开源在魔搭社区,欢迎开发者体验和反馈。

  • 量化后模型

点击链接了解更多

https://modelscope.cn/brand/view/Yi1_5

相关文章
|
3月前
|
人工智能 前端开发 算法
Qwen3.6全面评测:从代码生成到多模态识别的实战体验
Qwen3.6在代码生成(Python/React/算法)与多模态识别(图像理解、情感分析)方面表现卓越;支持Vibe Coding上下文连贯编程,百炼平台易接入、免费额度足、定价灵活,是开发者高效落地AI应用的优选国产大模型。(239字)
1047 0
|
9月前
|
机器学习/深度学习 PyTorch TensorFlow
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic,深度学习探索者。深耕TensorFlow与PyTorch,分享框架对比、性能优化与实战经验,助力技术进阶。
|
5月前
|
人工智能 自然语言处理 监控
2026年OpenClaw(原Clawdbot/Moltbot)极速安装到生产指南与企业级技能实战流程
OpenClaw(原Clawdbot/Moltbot)作为2026年开源AI智能体的标杆项目,在最新v2026.2.12版本中完成了核心架构的全面升级,不仅原生支持飞书、钉钉等主流办公通道,更通过与阿里云百炼大模型的深度适配,实现了中文场景下的推理性能与响应速度双提升。对于企业与个人用户而言,选择阿里云部署OpenClaw,既能依托云端稳定的计算环境与优化的网络链路,又能通过ClawHub生态的海量技能,快速解锁办公自动化、文档处理、浏览器操控、定时任务等全场景生产力功能。
691 13
|
5月前
|
运维 Prometheus 监控
抓包不如“开天眼”:用 eBPF 搭一条实时流量取样与可视化流水线
抓包不如“开天眼”:用 eBPF 搭一条实时流量取样与可视化流水线
401 5
|
4月前
|
弹性计算 运维 监控
阿里云监控使用
阿里云云监控(CloudMonitor)是实时监控云资源及自定义指标的SaaS服务,支持ECS、数据库等核心组件的性能监控(CPU/内存/磁盘等)。主要功能包括:1)通过Agent实现主机监控数据可视化;2)报警服务可配置多级联系人组,基于阈值规则自动触发告警通知;3)提供自定义监控大屏功能,支持多指标可视化展示;4)生成ECS巡检报告,评估安全合规性与性能状态。该服务帮助用户快速发现异常,保障业务稳定运行,适用于运维监控、性能优化及合规审计场景。
|
9月前
|
人工智能 弹性计算 双11
阿里云2025年双十一活动介绍
‌阿里云2025年双十一活动已开启,优惠时间从10月24日持续至11月30日‌,涵盖云服务器、AI大模型等产品,最高可领1728元优惠券,部分AI资源免费体验。
771 1
|
存储 机器学习/深度学习 人工智能
告别OOM!这款开源神器,如何为你精准预测AI模型显存?
在 AI 开发中,CUDA 显存不足常导致训练失败与资源浪费。Cloud Studio 推荐一款开源工具——AI 显存计算器,可精准预估模型训练与推理所需的显存,支持主流模型结构与优化器,助力开发者高效利用 GPU 资源。项目地址:github.com/st-lzh/vram-wuhrai
|
人工智能 Rust Apache
社区供稿 | 更长、更强、更开放,零一万物 Yi-1.5 系列开源模型发布一周广受好评
5 月 13 日,零一万物 Yi 系列开源模型全新升级为 Yi-1.5。相较于去年 11 月的开源版本,这次的 Yi-1.5 在保持原 Yi 系列模型优秀的通用语言能力的前提下,通过增量训练 500B 高质量 token,大幅提高了数学逻辑、代码能力。
|
机器学习/深度学习 存储 文字识别
阿里国际Ovis2系列模型开源:多模态大语言模型的新突破
Ovis是阿里巴巴国际化团队提出的新型多模态大模型架构,通过巧妙地将视觉和文本嵌入进行结构化对齐,为解决模态间嵌入策略差异这一局限性提供了方案。
1228 2
阿里国际Ovis2系列模型开源:多模态大语言模型的新突破
|
机器学习/深度学习 并行计算 PyTorch
使用PyTorch Profiler进行模型性能分析,改善并加速PyTorch训练
加速机器学习模型训练是工程师的关键需求。PyTorch Profiler提供了一种分析工具,用于测量CPU和CUDA时间,以及内存使用情况。通过在训练代码中嵌入分析器并使用tensorboard查看结果,工程师可以识别性能瓶颈。Profiler的`record_function`功能允许为特定操作命名,便于跟踪。优化策略包括使用FlashAttention或FSDP减少内存使用,以及通过torch.compile提升速度。监控CUDA内核执行和内存分配,尤其是避免频繁的cudaMalloc,能有效提升GPU效率。内存历史记录分析有助于检测内存泄漏和优化批处理大小。
2124 1

热门文章

最新文章