英伟达H100用11分钟训完GPT-3,PyTorch创始人:不要只看时间

简介: 英伟达H100用11分钟训完GPT-3,PyTorch创始人:不要只看时间


赢了,但没有全赢。


昨天,老黄又「赢麻了」!

为啥呢?原来在最新的 MLPerf 基准测试中,英伟达 H100 GPU 芯片组在以下八项基准测试中全部创下了新纪录,同时成为唯一一个跑完所有测试的硬件平台。

据悉,最新 MLPerf Training v3.0 包含了基于 GPT-3 175B 的大型语言模型(LLM)测试,侧重于生成式 AI 能力。

图源:MLPerf benchmarks。

LLM 训练测试中还使用了专注于 GPU 加速的云计算服务提供商 CoreWeave 提供的 NVIDIA HGX H100 基础设施,在多个规模上联合提交了 LLM 工作负载。

出来的结果令人振奋:在 896 个英特尔 Xeon Platinum 8462Y 和 3584 个英伟达 H100 芯片的合作下,仅仅用了 11 分钟就完成了基于 GPT-3 的 LLM 训练任务。

一时之间,AI 社区响起了老黄赢麻了的欢呼声。

可结果真如此吗?今天有人对此事提出了质疑。

先是 PyTorch 创始人 Soumith Chintala,他认为 GPT-3 并没有在 11 分钟内训练完成。使用 3584 个 H100 GPU,GPT-3 架构在 C4 数据集上训练了 11 分钟,对数概率为 2.69。

这里不要只关注「11 分钟」,因为这就像说「ResNet-50 在 MNIST(其实这里他想说的是 CIFAR100)上,5 秒内训练达到了 80%的准确率。」

推特用户 @abhi_venigalla 对 Soumith 的观点表示赞同,他是生成式 AI 创业公司 MosaicML 的研究者。他认为 MLPerf 基准测试中训练 GPT-3 的时间更可能是 2 天。

在他看来,该基准测试并不是完整的 GPT-3。MLPerf 的 LLM 基准只提供了一个开始的检查点,然后必须达到目标损失。

因此,该基准 11 分钟跑完 GPT-3 只覆盖 1.2B 的 token,而非完整的 300B token。此外看起来更像是 540 TFLOPs/H100,从配置上看像 FP8,~27% MFU。

不过他也承认,从 H100 在其软件生命周期早期这一点来看,以此规模实现现在这种性能也相当惊人。

所以,最新 MLPerf 基准测试中 11 分钟训完 GPT-3 是不是被误解呢?评论区的小伙伴也可以发表下自己的观点。

参考链接:https://developer.nvidia.com/blog/breaking-mlperf-training-records-with-nvidia-h100-gpus/

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
7月前
|
存储 PyTorch 算法框架/工具
【chat-gpt问答记录】关于pytorch中的线性层nn.Linear()
【chat-gpt问答记录】关于pytorch中的线性层nn.Linear()
147 0
|
存储 人工智能 自然语言处理
高性能计算与多模态处理的探索之旅:英伟达GH200性能优化与GPT-4V的算力加速未来
随着人工智能技术的不断发展,多模态大模型成为越来越重要的发展趋势。GPT-4V(GPT-4 近日开放的视觉模态)大型多模型(LMMs)扩展大型语言模型(LLMs)以增强多感知技能(如视觉理解等)从而实现更强大的通用智能。本文着重对GPT-4V进行深入分析,以进一步深化对LMM的理解。在此本文分析核心是GPT-4V可以执行的任务,同时包含用于探测其能力质量和通用性的测试样本。
|
机器学习/深度学习 并行计算 PyTorch
Windows系统下有英伟达显卡安装PyTorch
Windows系统下有英伟达显卡安装PyTorch
174 0
|
机器学习/深度学习 人工智能 自然语言处理
7 Papers & Radios | 英伟达把GPT-4塞进我的世界;比Adam快2倍的大模型预训练优化器
7 Papers & Radios | 英伟达把GPT-4塞进我的世界;比Adam快2倍的大模型预训练优化器
156 0
|
机器学习/深度学习 存储 人工智能
英伟达把GPT-4塞进我的世界,打游戏快15倍:AI大佬沉默了
英伟达把GPT-4塞进我的世界,打游戏快15倍:AI大佬沉默了
167 0
|
机器学习/深度学习 自然语言处理 PyTorch
|
机器学习/深度学习 PyTorch 算法框架/工具
|
6月前
|
存储 SQL 数据库
Python 金融编程第二版(GPT 重译)(四)(4)
Python 金融编程第二版(GPT 重译)(四)
60 3
|
6月前
|
存储 NoSQL 索引
Python 金融编程第二版(GPT 重译)(一)(4)
Python 金融编程第二版(GPT 重译)(一)
72 2
|
6月前
|
存储 机器学习/深度学习 关系型数据库
Python 金融编程第二版(GPT 重译)(四)(5)
Python 金融编程第二版(GPT 重译)(四)
40 2

热门文章

最新文章