TransGAN代码复现—九天毕昇平台

简介: TransGAN是UT-Austin、加州大学、 IBM研究院的华人博士生构建了一个只使用纯 transformer 架构、完全没有卷积的 GAN,并将其命名为 TransGAN。论文地址:https://arxiv.org/abs/2102.07074论文精读:论文精读 TransGAN代码地址:https://github.com/VITA-Group/TransGAN本篇博文是利用中国移动的九天毕昇平台复现TransGAN的博文。

@TOC

TransGAN是UT-Austin、加州大学、 IBM研究院的华人博士生构建了一个只使用纯 transformer 架构、完全没有卷积的 GAN,并将其命名为 TransGAN。

论文地址:https://arxiv.org/abs/2102.07074

论文精读:论文精读 TransGAN

代码地址:https://github.com/VITA-Group/TransGAN

本篇博文是利用中国移动的九天毕昇平台复现TransGAN的博文。

一、九天毕昇操作简介

首先介绍一下深度学习服务平台:“九天·毕昇”是中国移动开发的一款云服务平台,能够提供高效(最高显存32GB的V100)便捷(主要优点还是免费O(∩_∩)O)的算力。

点击链接注册即可免费赢取 1000 个算力豆(50 小时 V100 使用时长: https://jiutian.10086.cn/web#/register?token=NTIxNWNkOWEtNjIxZi00ZTIyLThlZTItNDhiYWQ3ODRiMDhm

1.1、进入控制台

进入首页后,点击进入控制台:

在这里插入图片描述

在这里插入图片描述

进入后可以看到存储空间,算力豆(九天毕昇算时的计算单位)和自己建立过的实例。

1.2、新建自己的实例

在这里插入图片描述

点击左侧导航栏,进入模型训练,点击新建实例

在这里插入图片描述

命名自己的实例名称,然后选择数据集(平台提供了一些数据集,选用平台数据集会自动加载在data/public文件夹中,但是平台只有

部分数据集,没有的数据集需要自己在数据管理或者在运行实例时进行上传)选择资源套餐。

1.3、进入实例

进入实例后,我们可以看到,和colab比较类似,左侧是文件资源部分,右侧可以进行编辑,

在这里插入图片描述

我们点击左上角的蓝色加号,新建一个notebook或者console或者最下面的terminal(看个人喜好),如果点击的是pytorch1.x,则平台就自动为了加载了最基础的pytorch环境。

在这里插入图片描述

二、复现TransGAN

2.1、下载git代码

首先进入终端terminal,克隆代码:

git clone https://github.com/VITA-Group/TransGAN

在这里插入图片描述

成功克隆后,项目代码如下:

在这里插入图片描述

2.2、配置环境

进入TransGAN:cd TransGAN,

然后根据requirement.txt下载安装环境:

pip install -r requirements.txt

可能会出现的问题:

ERROR: conda 4.11.0 requires ruamel_yaml_conda>=0.11.14, which is not installed.

ERROR: tensorflow 2.4.0 has requirement absl-py~=0.10, but you'll have absl-py 1.0.0 which is incompatible.

ERROR: tensorflow 2.4.0 has requirement flatbuffers~=1.12.0, but you'll have flatbuffers 2.0 which is incompatible.

ERROR: tensorflow 2.4.0 has requirement gast==0.3.3, but you'll have gast 0.5.3 which is incompatible.

ERROR: tensorflow 2.4.0 has requirement grpcio~=1.32.0, but you'll have grpcio 1.45.0 which is incompatible.

ERROR: tensorflow 2.4.0 has requirement h5py~=2.10.0, but you'll have h5py 3.6.0 which is incompatible.

ERROR: tensorflow 2.4.0 has requirement numpy~=1.19.2, but you'll have numpy 1.21.5 which is incompatible.

ERROR: tensorflow 2.4.0 has requirement six~=1.15.0, but you'll have six 1.16.0 which is incompatible.

ERROR: tensorflow 2.4.0 has requirement typing-extensions~=3.7.4, but you'll have typing-extensions 4.1.1 which is incompatible.

解决方案:这个的意思是tensorflow 2.4版本和一些其他环境的版本不能匹配。

需要重新安装TensorFlow:

pip install tensorflow

2.3、开始训练

在TransGAN目录下,输入:

python exps/cifar_train.py

开始训练:

在这里插入图片描述

训练的时间比较长,可能需要2天或者更久,我们也可以下载已经训练好的checkpoint进行测试(请看2.4)。

2.4、开始测试

如果2.3没有训练或者完,下载 cifar checkpoint并将其放到文件夹中:

在这里插入图片描述

最后输入测试命令,开始测试:

python exp/cifar_test.py

可能遇见的问题:

ModuleNotFoundError: No module named 'tensorflow._api'

解决方案1:

参考网上推测要在命令行装tensorflow-gpu,在命令行输入:

pip install --upgrade --ignore-installed tensorflow-gpu

解决方案2:

TensorFlow未安装成功,重新pip安装

福利

点赞、评论+收藏三连,可以私信我领取专属算力豆!(活动截止2022年6月29日)

在这里插入图片描述

相关文章
|
7月前
|
人工智能 自然语言处理 Java
AI生成代码加速代码屎山噩梦?
如今,许多程序员选择使用AI来辅助编程,但是随着AI软件开发的快速普及,有关代码质量的担忧越发凸显。
|
4月前
|
开发者 CDN 监控
【破局·提速】当Vaadin遇上性能怪圈:开发者的智慧较量与极速加载的实战秘籍!
【8月更文挑战第31天】本文详细介绍了优化Vaadin应用性能的方法,特别是提高加载速度的实战技巧。首先分析性能瓶颈,如服务器响应时间和数据库查询效率等;然后通过代码优化、数据分页与急切加载技术减少资源消耗;接着利用资源压缩合并及CDN加速,进一步提升加载速度;最后通过持续性能监控和测试确保优化效果。通过综合应用这些策略,可显著改善用户体验。
78 0
|
5月前
|
人工智能 算法
等不来OpenAI的Q*,华为诺亚探索LLM推理的秘密武器MindStar先来了
【7月更文挑战第13天】华为诺亚方舟实验室推出MindStar,一种增强LLM推理能力的搜索框架。MindStar通过PRM奖励模型和Beam/Levin Search策略选择最佳推理路径,提升开源模型如LLaMA-2-13B、Mistral-7B的性能,与GPT-3.5等闭源模型媲美,但成本更低。尽管推理成本高和需预训练PRM,MindStar为LLM推理研究开辟新途径。[论文链接](https://arxiv.org/pdf/2405.16265v4)
91 9
|
人工智能 JavaScript API
AI 加成?翻译贼 6?deepl 踩坑记
昨儿个老板突然让把某官网文档翻译成英文,文档是 markdown 写的,好像有上百篇吧,人工翻译是不可能了,所以找到了 deepl 的 API,打算让我脚本快速翻一下。所以就成功让我水出了本篇。
值得一看!阿里又杀疯了开源内部“M9”级别全彩版分布式实战笔记
系统架构大致经历了单体应用架构→垂直应用架构→分布式架构→SOA架构→微服务架构的演变
|
人工智能 自然语言处理 安全
AI卷趴程序员!DeepMind祭出竞赛级代码生成系统AlphaCode,超越近半码农
AI卷趴程序员!DeepMind祭出竞赛级代码生成系统AlphaCode,超越近半码农
134 0
|
人工智能 并行计算 架构师
CUDA编程模型都改了!英伟达架构师团队撰文详解:Hopper为啥这么牛?
CUDA编程模型都改了!英伟达架构师团队撰文详解:Hopper为啥这么牛?
366 0
|
算法 测试技术
|
人工智能 前端开发 JavaScript
热饭的测开成果盘点第十期:测试平台OneKey(一)
!! 本期要分享的是一款集成各种功能的测试平台,所以功能非常之多。本期也属于超重量级的一期,请仔细观看。因为展示的是脱敏的测试环境,所以数据统计等不要在意。
热饭的测开成果盘点第十期:测试平台OneKey(一)