解密 <code>HuggingFace</code> 模型命名规则 - YongQiang 的博客

HuggingFace Logo

本文系统解析 HuggingFace 模型库的命名规范, 帮助开发者快速理解模型特性.

命名组件解析

典型模型名称示例:

Qwen2-0.5B-Instruct-FP16

可拆解为以下几个核心组件:

组件	说明	可选值示例
模型系列	基础架构名称	Qwen/Llama/Intern/其它
版本号	架构迭代版本	1.5/2/2.5/其它
参数量	模型规模标识	0.5B/4B/7B/72B/其它
功能后缀	模型优化方向	Chat/Instruct/VL/Coder/Audio/Math/其它
量化方法	量化压缩的方法`(可选)`	GPTQ/AWQ/其它
精度标识	量化压缩方案`(可选)`	Int4/Int8/BF16/FP16/其它
参数格式	模型参数保存的格式`(可选)`	GGUF/Safetensors/其它

功能后缀详解

1. Chat 系列

核心定位: 对话场景优化

# 典型调用方式
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("Qwen1.5-4B-Chat")

训练特征:

多轮对话历史跟踪
上下文连贯性增强
情感响应模拟

应用场景:

智能客服系统
社交陪伴机器人
对话式搜索引擎

2. Instruct 系列

核心定位: 指令精准执行

# 典型工作流
instruction = "用 Python 分析这份销售数据, 生成可视化图表"
response = model.generate(instruction)

训练特征:

结构化指令解析
任务分解能力增强
操作步骤标准化

应用场景:

自动化流程引擎
代码生成助手
数据分析平台

3. VL 系列

核心定位: 多模态融合处理

训练特征:

CLIP-like 视觉编码器
图文跨模态注意力机制
多模态联合表示空间

应用场景:

医学影像报告生成
工业质检图文记录
电商商品智能描述

扩展标识说明

1. 参数规模标识

标识	实际参数量	典型硬件需求
0.5B	5亿	NVIDIA T4 (8GB)
7B	70亿	RTX 3090 (24GB)
72B	720亿	A100 (80GB)

2. 精度标识

FP16: 半精度浮点 (推理速度↑30%)
Int4: 4位整型量化 (显存占用↓60%)
GGUF: Llama.cpp 专用格式 (CPU优化)

选型建议

对话场景优先选择 Chat 系列
需要处理图文数据时必选 VL 后缀
0.5B~7B 参数适合单卡部署
生产环境推荐使用量化版本

Reference

https://huggingface.co/

解密 `HuggingFace` 模型命名规则

命名组件解析

功能后缀详解

1. Chat 系列

2. Instruct 系列

3. VL 系列

扩展标识说明

1. 参数规模标识

2. 精度标识

选型建议

Reference

CATALOG

FEATURED TAGS

FRIENDS