关于代价函数的两个假设

反向传播算法的目标:求出代价函数C在任意w、b处的偏导C/w\partial C / \partial wC/b\partial C / \partial b

反向传播函数对代价函数有两个假设,以第一章所使用的二次代价函数为例:

假设一

假设一:代价函数C可以写成每个样本的代价函数之和的形式

C=1nxCxC = \frac{1}{n} \sum_x C_x

例如对于公式26来说,有

Cx=12yaL2(1)C_x = \frac{1}{2} \|y-a^L \|^2 \tag{1}

问:为什么会有这样的假设? 答:因为反向传播算法是针对每个样本单独计算偏导的。

假设二

假设二:代价函数CxC_x可以写成神经元视角的形式。 神经元视角是我发明的词,我不知道怎么表达这种形式。参见link

例如公式(1)可以写成

Last updated