Skip to content

Regularization

可以把正则化分为这几类:

  • 显式正则化 (Explicit Regularization) :直接在 Loss 函数后面加一项。
  • L1 / L2 (Weight Decay)
  • Entropy Regularization
  • 结构/计算正则化 :改变网络结构或计算方式。
  • Dropout (随机让神经元罢工)
  • Label Smoothing (软化目标)
  • 过程正则化 :改变训练流程。
  • Early Stopping (提前结束)
  • Adversarial Training (对抗训练)
  • 数据正则化
  • Data Augmentation (数据增强)
  • Mixup / Cutout

更多的Regularization的内容我单开了一个章节去整理,因为在Transformer时代,正则化本身成为了一个非常重要的内容。同时,深度学习训练中的数据增强等广义正则化范畴的内容,也会在Regularization笔记中展开学习。


评论 #