在 上一节 中,我们知道对偶函数的极大化与最大熵模型的极大似然估计是等价的,因此,我们可以通过求解最大熵模型的极大似然估计问题来求解对偶函数的极大化问题,进而求解原始优化问题,这也是本节介绍的改进的迭代尺度法的思路。而拟牛顿法可通过直接求解的方式得到最优化的最大熵模型。
改进的迭代尺度法
在 上一节 中我们得到的最大熵模型的对数似然函数为:
$$\mathcal{L}(w)=\Sigma_{x,y}\widetilde{P}(x,y)\Sigma_{i=1}^nw_if_i(x, y)-\Sigma_x\widetilde{P}(x)logZ_w(x)$$
其中,$Z_w(x)=\Sigma_yexp(\Sigma_{i=1}^nw_if_i(x, y))$。