深入模型效率 4 分钟

稀疏化训练

让模型“轻装上阵”

概述

降低计算成本的精简训练方法

稀疏化训练（Sparse Training）是一种优化技术，通过将模型中的某些权重置为零，从而减少计算和存储需求。这种方式不仅加速了训练过程，还降低了内存占用，适用于资源受限的设备部署。

想象你在整理衣柜，将那些不常穿、不重要的衣服清理出去，留下最常用的衣服，既节省空间又方便挑选。稀疏化训练就是类似的过程，只保留模型中最重要的参数，去掉“冗余部分”。

1️⃣ 初始化模型参数

↓

2️⃣ 筛选不重要的参数并置为零

↓

3️⃣ 训练时仅更新重要权重

↓

4️⃣ 输出

稀疏化训练的核心在于找到并删除不重要的参数：

通过稀疏化，模型在大幅减少参数的同时，仍能保持接近原始模型的性能，适用于计算资源有限的场景。