Hugging Face 模型格式大揭秘:从 PyTorch 到 GGUF,一文搞懂!

人工智能
通过这篇文章,我们一起了解了 Hugging Face 上常见的模型格式,从 PyTorch 的灵活易用到 SafeTensors 的安全高效,再到 ONNX 和 GGUF 在跨平台与轻量化部署上的独特优势,每种格式都有其独到之处。

还记得我刚接触 Hugging Face 时,面对各种模型格式和一堆陌生的文件名,我的脑袋瞬间宕机。

每次下载模型时,我都在想:“这堆 .bin、.json、.txt 究竟是干啥的?”后来,随着我不断摸索,终于搞清楚了这些文件的门道。

今天,我就来帮大家捋清楚 Hugging Face 上模型的常见格式,以及每种格式里到底都装了些什么。

常见模型格式概览

在 Hugging Face 上,模型主要有以下几种格式:

  • PyTorch 格式
  • TensorFlow 格式
  • Flax(JAX)格式
  • SafeTensors 格式
  • ONNX 格式
  • GGUF 格式

接下来,我们逐一拆解每种格式及其包含的关键文件。

PyTorch 格式

PyTorch 格式是 Hugging Face 上最常见的模型格式,适用于使用 PyTorch 框架的开发者。它的核心文件包括: 

pytorch_model.bin

模型的权重文件,包含了训练过程中学到的参数,类似于模型的大脑。 

config.json

模型配置文件,记录了网络结构、层数、隐藏维度等关键信息,相当于模型的“身份证”。 

tokenizer_config.json

分词器的配置信息,告诉模型如何处理输入文本。

vocab.txt或vocab.json

模型使用的词汇表,记录了每个词及其对应的编号。 

special_tokens_map.json

定义特殊标记(如 [CLS]、[SEP]、[PAD] 等)的映射规则。

merges.txt

仅限 BPE 分词器,描述词汇合并规则,是 BPE 分词算法的关键文件。

TensorFlow 格式

TensorFlow 模型在 Hugging Face 上也很常见,特别是那些使用 Keras 的开发者更喜欢这种格式。它的主要文件包括: 

tf_model.h5或saved_model.pb等

模型的权重文件,包含了训练过程中学到的参数,类似于模型的大脑。 

config.json

模型配置文件,记录了网络结构、层数、隐藏维度等关键信息,相当于模型的“身份证”。

注:其他文件作用与 PyTorch 版本相同。

Flax(JAX)格式

Flax 是基于 JAX 的神经网络库,专为高性能、加速计算而生。Flax 格式的 Hugging Face 模型通常包含以下文件: 

flax_model.msgpack

模型的权重文件,使用 MessagePack 格式,兼顾高效与紧凑。 

config.json

模型配置文件,记录了网络结构、层数、隐藏维度等关键信息,相当于模型的“身份证”。 

tokenizer_config.json

分词器的配置信息,告诉模型如何处理输入文本。

注:其他配置文件与 PyTorch、TensorFlow 格式类似。

SafeTensors 格式

SafeTensors 是 Hugging Face 推出的新一代安全格式,主打“安全、快速、内存友好”。 

model.safetensors

模型的核心权重文件,避免了 .bin 文件在加载时的潜在安全风险。 

config.json

模型配置文件,记录了网络结构、层数、隐藏维度等关键信息,相当于模型的“身份证”。 

tokenizer_config.json

分词器的配置信息,告诉模型如何处理输入文本。

vocab.txt或vocab.json

模型使用的词汇表,记录了每个词及其对应的编号。

special_tokens_map.json

定义特殊标记(如 [CLS]、[SEP]、[PAD] 等)的映射规则。

merges.txt

仅限 BPE 分词器,描述词汇合并规则,是 BPE 分词算法的关键文件。

注:配置、词汇表和特殊标记映射等文件仍与 PyTorch 格式类似。

SafeTensors 格式以其更高效的加载速度和更安全的数据结构,逐渐成为 Hugging Face 上的新宠。

ONNX 格式

ONNX是一种开放的模型交换格式,旨在帮助不同框架之间的模型互操作。ONNX 格式的 Hugging Face 模型通常包含: 

model.onnx

核心模型权重文件,支持多平台部署(如 TensorRT、ONNX Runtime 等)。

config.json

模型配置文件,记录了网络结构、层数、隐藏维度等关键信息,相当于模型的“身份证”。 

tokenizer_config.json

分词器的配置信息,告诉模型如何处理输入文本。

注:配置、词汇表和特殊标记映射等文件仍与 PyTorch 格式类似。

GGUF 格式

GGUF是一种专为 GPT 类模型设计的新型格式,强调易用性和高效部署。它的主要包括: 

model.gguf

核心模型权重文件,优化了 GPT 系列模型的参数存储,适合高效推理和快速加载。自包含所有数据,包括配置和分词器信息。

注:GGUF 格式特别适合 GPT 模型在轻量化环境下的部署,性能优异且便于迁移。

模型格式对比表

图片

通过这篇文章,我们一起了解了 Hugging Face 上常见的模型格式,从 PyTorch 的灵活易用到 SafeTensors 的安全高效,再到 ONNX 和 GGUF 在跨平台与轻量化部署上的独特优势,每种格式都有其独到之处。

希望这篇指南能让你在面对琳琅满目的 `.bin`、`.h5`、`.onnx` 和 `.gguf` 文件时不再迷茫,轻松选出最适合你的“武器”。祝你在模型的世界里探索愉快,跑得又快又稳!

责任编辑:庞桂玉 来源: 写代码的中年人
相关推荐

2024-09-04 16:19:06

语言模型统计语言模型

2024-09-26 10:42:20

2024-04-12 12:19:08

语言模型AI

2025-03-31 08:50:00

模型量化神经网络AI

2022-03-24 08:51:48

Redis互联网NoSQL

2024-11-05 14:00:56

2023-09-08 08:20:46

ThreadLoca多线程工具

2023-09-15 12:00:01

API应用程序接口

2021-03-22 10:05:59

netstat命令Linux

2025-03-12 02:00:00

经营分析模型策略

2020-01-14 12:08:32

内存安全

2024-09-13 17:02:29

2024-06-05 11:43:10

2022-08-15 15:39:23

JavaScript面向对象数据

2023-08-24 16:50:45

2021-06-30 08:45:02

内存管理面试

2023-04-03 15:04:00

RPCPHP语言

2020-03-18 14:00:47

MySQL分区数据库

2021-01-13 05:21:59

参数

2019-11-19 08:00:00

神经网络AI人工智能
点赞
收藏

51CTO技术栈公众号