根据最大熵的学习过程推导最大熵模型
Last updated
Last updated
最大熵的学习过程是一种数学计算方法 最大熵模型是一种机器学习模型 虽然都带有“最大熵”这三个字,但不是一回事
将求最大值问题改写成求最小值问题。将condition换一种写法。
根据约束条件定义拉格朗日函数
L(P, w)对每个求偏导,并这些偏导= 0
根据第4步得到K个等式。通过这K个等式,解出,这些值都是用w表达的式子
对每个P(y|x)来说公式是一样的。
代入到第3步中的,将得到新的
令新的
这里的就叫对偶函数,同时其解记作
现在要极大化对偶函数。按照上一节的“最大熵学习过程”,将对所有w分别求并令导入为0,即可解出w*,进而代入第5步专求出最终结果。
但在求最大熵模型的对偶函数的极大化时,并没有使用这种方法的,而是使用了目标函数最优化问题中的方法来求w*。