高阶模型效率 4 分钟

低秩分解

模型压缩与加速的核心技术

概述

用更少参数近似原模型，降低计算与存储成本

低秩分解（Low-rank Factorization）是一种用于优化模型的技术，通过将大型矩阵分解为几个低秩的小矩阵，减少参数数量和存储需求，同时保留矩阵中的主要特征信息。它是压缩高维权重矩阵和提高计算效率的常用方法。

想象一幅复杂的彩色画，原画可能需要很多细节来描绘，但通过用几块透明的彩色塑料片叠加，便可以近似还原原画的大致内容。低秩分解就像这种方法，把复杂矩阵拆分成小矩阵，虽然精细度降低，但保留了最关键的信息，既节省了资源，又足够实用。

🌱 什么是“秩”？

矩阵的“秩”表示它所包含的独立信息量，通俗来说，就是描述这个矩阵需要的最少线性成分。

高秩：信息复杂、冗余多，比如一幅极其复杂的画面。

低秩：信息精简，保留核心内容，比如一幅画的简洁版，只包含重要线条和颜色。

1.参数压缩：用低秩矩阵近似高维矩阵，显著减少参数数量。

2.高效计算：分解后的矩阵计算复杂度更低，速度更快。

1️⃣ 输入高维矩阵

↓

2️⃣ 分解为多个低秩矩阵

↓

3️⃣ 替换原始矩阵进行计算

↓

4️⃣ 保留主要特征的同时提升效率

低秩分解的核心在于将复杂矩阵拆分为秩更低的矩阵，以减少存储和计算需求：

通过低秩分解，模型能够在计算资源有限的环境中高效运行，同时保持预测性能的稳定性。

1.分解即优化：低秩分解通过矩阵拆分实现存储和计算的双重优化。

2.基础方法：了解SVD、NMF等分解技术，有助于深入掌握模型压缩的核心原理。