这里说的正则化参数是指L2正则化参数λ\lambdaλ。 一开始设置λ=0\lambda=0λ=0,即不使用正则化。 先调学习率η\etaη。 η\etaη定下来后再调λ\lambdaλ。 调λ\lambdaλ的过程也是先确定λ\lambdaλ的量级,再找最合适的λ\lambdaλ。 λ\lambdaλ确定后,重新调整η\etaη。
Last updated 4 years ago