备案控制台

blackswan_xdu-25928_个人页

blackswan_xdu-25928

文章

4

问答

0

视频

0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

文章
问答
视频

发表了文章 2024-12-04

Qwen2-VL微调实战：LaTex公式OCR识别任务（完整代码）

《SwanLab机器学习实战教程》推出了一项基于Qwen2-VL大语言模型的LaTeX OCR任务，通过指令微调实现多模态LLM的应用。本教程详述了环境配置、数据集准备、模型加载、SwanLab集成及微调训练等步骤，旨在帮助开发者轻松上手视觉大模型的微调实践。
发表了文章 2024-06-18

Stable Diffusion火影数据集训练：SwanLab可视化训练

**使用Stable Diffusion 1.5模型训练火影忍者风格的文生图模型。在22GB显存的GPU上，通过Huggingface的`lambdalabs/naruto-blip-captions`数据集进行训练，利用SwanLab进行监控。所需库包括`swanlab`, `diffusers`, `datasets`, `accelerate`, `torchvision`, `transformers`。代码、日志和更多资源可在GitHub和SwanLab找到。训练涉及数据下载、模型配置、训练过程可视化及结果评估。**
发表了文章 2024-06-09

BERT-IMDB电影评论情感分类实战：SwanLab可视化训练

这篇文章介绍了使用BERT模型进行IMDB电影评论情感分类的实战教程，涉及SwanLab、transformers和datasets库。作者提供了一键安装库的命令，并详细解释了每个库的作用。文章展示了如何加载BERT模型和IMDB数据集，以及如何利用SwanLab进行可视化训练。训练过程在SwanLab平台上进行，包括模型微调、指标记录和结果可视化。此外，还提供了完整代码、模型与数据集的下载链接，以及相关工具的GitHub仓库地址。
发表了文章 2024-06-09

Qwen2大模型微调入门实战（完整代码）

该教程介绍了如何使用Qwen2，一个由阿里云通义实验室研发的开源大语言模型，进行指令微调以实现文本分类。微调是通过在（指令，输出）数据集上训练来改善LLMs理解人类指令的能力。教程中，使用Qwen2-1.5B-Instruct模型在zh_cls_fudan_news数据集上进行微调，并借助SwanLab进行监控和可视化。环境要求Python 3.8+和英伟达显卡。步骤包括安装所需库、准备数据、加载模型、配置训练可视化工具及运行完整代码。训练完成后，展示了一些示例以验证模型性能。相关资源链接也一并提供。

暂无更多信息

发表了文章 2024-12-04

Qwen2-VL微调实战：LaTex公式OCR识别任务（完整代码）
发表了文章 2024-06-18

Stable Diffusion火影数据集训练：SwanLab可视化训练
发表了文章 2024-06-09

BERT-IMDB电影评论情感分类实战：SwanLab可视化训练
发表了文章 2024-06-09

Qwen2大模型微调入门实战（完整代码）

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息