IIS,improved iterative scaling
最大熵模型学习的最优化算法
背景
在根据最大熵的学习过程推导最大熵模型中已经求出了最大熵模型。想要解出最大熵模型就要先解出“最大熵模型的对偶函数的极大化”。
在证明:对偶函数的极大化=模型的极大似然估计中已证明”最大熵模型的对偶函数的极大化=最大熵模型的对数似然函数的极大似然估”。这个问题又进一步转化为求“最大熵模型的对数似然函数的极大似然估”。
即找到一个w使得L(w)最大
L(w)=x,y∑P~(x,y)i=1∑nwifi(x,y)−x∑P~(x)logZw(x) 算法过程
算法6.1 改进的迭代尺度算法 IIS
输入:
特征函数f1,f2,⋯,fn
经验分布:P~(X,Y)
模型:Pw(Y∣X)
输出:
最优模型参数wi∗
最优模型Pw∗
过程:
1. 对所有i∈1,2,⋯,n,取初值wi=0
2. 选择一个i∈1,2,⋯,n,令δi满足方程:
x,y∑P~(x)Pw(y∣x)fi(x,y)exp(δi)f#(x,y))=EP~(fi)f#=i∑fi(x,y)1 求解δi
3. wi=wi+δi 4. 如果不是所有wi都收敛,迭代进行2,3