梯度消失问题

问:梯度小是因为参数已经接近目标不需要调整了吗? 答:不是。因为初值是随机初始化的,不太可能一开始就接近目标了。 [?]还有一句没看懂

The random initialization means the first layer throws away most information about the input image.

Last updated