进阶学习范式 4 分钟

自监督学习

AI的“自我教育”

概述

现在最流行的预训练方式

自监督学习（Self-supervised Learning）是一种无监督学习的形式，AI通过从输入数据中自行生成标签来学习，从而在没有外部标注的情况下进行训练。这种方法通过数据本身的结构来引导学习过程，尤其适用于大规模未标注数据。

就像你学会做菜时，没有专门的老师指导你，而是通过看菜谱、自己动手做、然后调整味道来不断完善自己的技巧。

1.图像修复：根据部分图像数据预测丢失的部分。

2.特征学习：从原始数据中自动提取出有用的特征。

1.数据自标注：AI通过输入数据自身生成学习信号，而不需要人工标注。

2.自我优化：AI通过自我反馈不断优化学习效果。

3.无监督学习：大多数情况下，AI并不依赖标签数据，而是通过探索数据之间的内在联系来学习。

1️⃣ 输入数据
↓
2️⃣ 自我生成标签
↓
3️⃣ 学习并优化
↓
4️⃣ 输出结果

自监督学习利用输入数据本身的结构来进行自我标注，并通过这种标注来优化学习过程。AI通过对数据的自我监督和反馈，不断提高预测精度，减少对人工标注的依赖。

1.监督学习 vs 无监督学习：

自监督学习通过数据间的关系自动生成标签，而无监督学习不依赖任何标签。

2.自监督学习 vs 半监督学习：

自监督学习只用未标记数据，自行生成学习信号；半监督学习则结合少量标记数据与大量未标记数据。

3.自监督学习 vs 自主学习：

自监督学习通过数据自我学习，依赖数据内部的模式；自主学习强调AI通过与环境互动，自主探索优化行为。