L1正则化

L1正则化的原理与L2相同，都是通过添加一个正则项来限制weights的大小。

w的偏导公式为：

w的更新公式为：

L1 VS L2

L1的shrink大小为常数。当|w|较大时，L2 shrink更快。当|w|较小时，L1 shrink更快。
L1倾向于使weights留在重要的connect上，而使其它connect趋向于0。

Previous其它问题 Nextdropout正则化

Last updated 6 years ago