Hugging Face 模型格式大揭秘：从 PyTorch 到 GGUF，一文搞懂！-51CTO.COM

还记得我刚接触 Hugging Face 时，面对各种模型格式和一堆陌生的文件名，我的脑袋瞬间宕机。

每次下载模型时，我都在想：“这堆 .bin、.json、.txt 究竟是干啥的？”后来，随着我不断摸索，终于搞清楚了这些文件的门道。

今天，我就来帮大家捋清楚 Hugging Face 上模型的常见格式，以及每种格式里到底都装了些什么。

常见模型格式概览

在 Hugging Face 上，模型主要有以下几种格式：

PyTorch 格式
TensorFlow 格式
Flax（JAX）格式
SafeTensors 格式
ONNX 格式
GGUF 格式

接下来，我们逐一拆解每种格式及其包含的关键文件。

PyTorch 格式

PyTorch 格式是 Hugging Face 上最常见的模型格式，适用于使用 PyTorch 框架的开发者。它的核心文件包括：

pytorch_model.bin
模型的权重文件，包含了训练过程中学到的参数，类似于模型的大脑。
config.json
模型配置文件，记录了网络结构、层数、隐藏维度等关键信息，相当于模型的“身份证”。
tokenizer_config.json
分词器的配置信息，告诉模型如何处理输入文本。
vocab.txt或vocab.json
模型使用的词汇表，记录了每个词及其对应的编号。
special_tokens_map.json
定义特殊标记（如 [CLS]、[SEP]、[PAD] 等）的映射规则。
merges.txt
仅限 BPE 分词器，描述词汇合并规则，是 BPE 分词算法的关键文件。

TensorFlow 格式

TensorFlow 模型在 Hugging Face 上也很常见，特别是那些使用 Keras 的开发者更喜欢这种格式。它的主要文件包括：

tf_model.h5或saved_model.pb等
模型的权重文件，包含了训练过程中学到的参数，类似于模型的大脑。
config.json
模型配置文件，记录了网络结构、层数、隐藏维度等关键信息，相当于模型的“身份证”。

注：其他文件作用与 PyTorch 版本相同。

Flax（JAX）格式

Flax 是基于 JAX 的神经网络库，专为高性能、加速计算而生。Flax 格式的 Hugging Face 模型通常包含以下文件：

flax_model.msgpack
模型的权重文件，使用 MessagePack 格式，兼顾高效与紧凑。
config.json
模型配置文件，记录了网络结构、层数、隐藏维度等关键信息，相当于模型的“身份证”。
tokenizer_config.json
分词器的配置信息，告诉模型如何处理输入文本。

注：其他配置文件与 PyTorch、TensorFlow 格式类似。

SafeTensors 格式

SafeTensors 是 Hugging Face 推出的新一代安全格式，主打“安全、快速、内存友好”。

model.safetensors
模型的核心权重文件，避免了 .bin 文件在加载时的潜在安全风险。
config.json
模型配置文件，记录了网络结构、层数、隐藏维度等关键信息，相当于模型的“身份证”。
tokenizer_config.json
分词器的配置信息，告诉模型如何处理输入文本。
vocab.txt或vocab.json
模型使用的词汇表，记录了每个词及其对应的编号。
special_tokens_map.json
定义特殊标记（如 [CLS]、[SEP]、[PAD] 等）的映射规则。
merges.txt
仅限 BPE 分词器，描述词汇合并规则，是 BPE 分词算法的关键文件。

注：配置、词汇表和特殊标记映射等文件仍与 PyTorch 格式类似。

SafeTensors 格式以其更高效的加载速度和更安全的数据结构，逐渐成为 Hugging Face 上的新宠。

ONNX 格式

ONNX是一种开放的模型交换格式，旨在帮助不同框架之间的模型互操作。ONNX 格式的 Hugging Face 模型通常包含：

model.onnx
核心模型权重文件，支持多平台部署（如 TensorRT、ONNX Runtime 等）。
config.json
模型配置文件，记录了网络结构、层数、隐藏维度等关键信息，相当于模型的“身份证”。
tokenizer_config.json
分词器的配置信息，告诉模型如何处理输入文本。

注：配置、词汇表和特殊标记映射等文件仍与 PyTorch 格式类似。

GGUF 格式

GGUF是一种专为 GPT 类模型设计的新型格式，强调易用性和高效部署。它的主要包括：

model.gguf
核心模型权重文件，优化了 GPT 系列模型的参数存储，适合高效推理和快速加载。自包含所有数据，包括配置和分词器信息。

注：GGUF 格式特别适合 GPT 模型在轻量化环境下的部署，性能优异且便于迁移。

模型格式对比表

通过这篇文章，我们一起了解了 Hugging Face 上常见的模型格式，从 PyTorch 的灵活易用到 SafeTensors 的安全高效，再到 ONNX 和 GGUF 在跨平台与轻量化部署上的独特优势，每种格式都有其独到之处。

希望这篇指南能让你在面对琳琅满目的 `.bin`、`.h5`、`.onnx` 和 `.gguf` 文件时不再迷茫，轻松选出最适合你的“武器”。祝你在模型的世界里探索愉快，跑得又快又稳！