大模型中 .safetensors 文件、.ckpt文件、.gguf和.pth以及.bin文件区别、加载和保存以及转换方式-阿里云开发者社区

大模型中 .safetensors 文件、.ckpt文件、.gguf和.pth以及.bin文件区别、加载和保存以及转换方式

2024-10-12 239

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文讨论了大模型中不同文件格式如`.safetensors`、`.ckpt`、`.gguf`、`.pth`和`.bin`的区别、用途以及如何在TensorFlow、PyTorch和ONNX等框架之间进行加载、保存和转换。

在大模型中，.safetensors、.ckpt、.gguf、.pth 和 .bin 文件都是用于保存和加载模型参数的文件格式，它们之间的区别和转换方式如下：

.safetensors 文件：
- 这是 TensorFlow 2.x 中新增的文件格式，用于保存模型参数和优化器状态。
- 它采用的是 TensorFlow 的自定义序列化格式，不能直接用于其他框架。
- 可以使用 TensorFlow 的 tf.train.Checkpoint 类来加载和保存 .safetensors 文件。
.ckpt 文件：
- 这是 TensorFlow 1.x 中用于保存模型参数和优化器状态的文件格式。
- 它采用的是 TensorFlow 的自定义序列化格式，不能直接用于其他框架。
- 可以使用 TensorFlow 的 tf.train.Saver 类来加载和保存 .ckpt 文件。
- 可以使用 TensorFlow 2.x 的 tf.compat.v1.train.Saver 类来加载和保存 .ckpt 文件。
.gguf 文件：
- 这是 Google 的 GFST（Google Finite State Transducer）格式，用于保存语言模型。
- 它采用的是 Google 的自定义序列化格式，不能直接用于其他框架。
- 可以使用 Google 的 fstcompile 和 fstrain 工具来加载和保存 .gguf 文件。
.pth 文件：
- 这是 PyTorch 中用于保存模型参数和优化器状态的文件格式。
- 它采用的是 PyTorch 的自定义序列化格式，不能直接用于其他框架。
- 可以使用 PyTorch 的 torch.save 函数来加载和保存 .pth 文件。
.bin 文件：
- 这是一种通用的二进制文件格式，可以用于保存模型参数和优化器状态。
- 它可以被多种框架所使用，例如 TensorFlow、PyTorch 和 ONNX 等。
- 可以使用 NumPy 或 PyTorch 等框架的函数来加载和保存 .bin 文件。

对于这些文件格式之间的转换，可以使用以下方法：

.ckpt 文件到 .pth 文件：
- 可以使用 TensorFlow 2.x 的 tf.compat.v1.train.Saver 类来加载 .ckpt 文件，然后使用 PyTorch 的 torch.Tensor.cpu 函数将模型参数转换为 CPU 张量，最后使用 PyTorch 的 torch.save 函数保存为 .pth 文件。
.pth 文件到 .ckpt 文件：
- 可以使用 PyTorch 的 torch.load 函数加载 .pth 文件，然后使用 TensorFlow 2.x 的 tf.convert_to_tensor 函数将模型参数转换为 TensorFlow 张量，最后使用 TensorFlow 2.x 的 tf.train.Checkpoint 类保存为 .ckpt 文件。
.ckpt 文件或 .pth 文件到 ONNX 模型：
- 可以使用 TensorFlow 2.x 的 tf2onnx.convert 函数或 PyTorch 的 torch.onnx.export 函数将模型转换为 ONNX 模型，然后使用 ONNX 的 onnxruntime.InferenceSession 类加载和使用 ONNX 模型。
ONNX 模型到 .pth 文件或 .ckpt 文件：
- 可以使用 ONNX 的 onnxruntime.InferenceSession 类加载 ONNX 模型，然后使用 PyTorch 的 torch.Tensor 或 TensorFlow 2.x 的 tf.convert\_to\_tensor 函数将模型参数转换为 PyTorch 或 TensorFlow 张量，最后使用 PyTorch 的 torch.save 函数或 TensorFlow 2.x 的 tf.train.Checkpoint 类保存为 .pth 文件或 .ckpt 文件。
.gguf 文件到 ONNX 模型：
- 可以使用 Google 的 fst2onnx 工具将 .gguf 文件转换为 ONNX 模型，然后使用 ONNX 的 onnxruntime.InferenceSession 类加载和使用 ONNX 模型。
ONNX 模型到 .gguf 文件：
- 可以使用 ONNX 的 onnxruntime.InferenceSession 类加载 ONNX 模型，然后使用 Google 的 onnx2fst 工具将 ONNX 模型转换为 .gguf 文件。

需要注意的是，由于不同框架之间的 API 和序列化格式的差异，在进行转换时可能需要进行一些额外的处理，例如调整数据类型、调整形状、调整维度等。

大模型中 .safetensors 文件、.ckpt文件、.gguf和.pth以及.bin文件区别、加载和保存以及转换方式

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

大模型中 .safetensors 文件、.ckpt文件、.gguf和.pth以及.bin文件区别、加载和保存以及转换方式

热门文章

最新文章

相关电子书