最大熵的学习过程
Last updated
Was this helpful?
Last updated
Was this helpful?
最大熵模型的学习 = 求解最大熵模型 = 带约束的最优化模型 = 无约束最优化的对偶问题
定义: K:y可能的取值数
列出已知的求最大熵公式和限制条件:
将求最大值问题改写成求最小值问题。将condition换一种写法
定义
“第一步是把 \alpha, \beta当做常数,求\theta_p(x)。”在这里就是把L(P, w)对每个求偏导,并这些偏导= 0
根据第4步得到K个等式。通过这K个等式,解出,这些值都是用w表达的式子
代入到第3步中的,将得到新的
将新的分别为所有的w求导,并令这些偏导为0
根据7得出n个等式,计算这些等式,解得w
把w代入5,得到所有的P(y),也可以跳过第8步,直接计算出P(y)