遗留问题

  1. 梯度下降法的收敛证明 公式(7),怎么证明w^0w^opt0\hat w_0 \cdot \hat w_{opt} \ge 0

  2. CS229里面说感知机算法没有数学依据?

  3. 决策树的剪枝算法 只实际了递归算法,怎么用DP实现?

  4. CART树的剪枝 为什么算法2步要强调自下而上计算g(t)?既然要把所有的a求出来,先算哪个结点的a应该不影响结果。

  5. [A(δw)A(\delta|w)B(δw)B(\delta|w)推导] A(δw)A(\delta|w)的推导 (https://windmising.gitbook.io/lihang-tongjixuexifangfa/option/10) 公式(3)怎么推导到公式(4)

  6. [A(δw)A(\delta|w)B(δw)B(\delta|w)推导] (https://windmising.gitbook.io/lihang-tongjixuexifangfa/option/10) B(δw)B(\delta|w)的推导 一次只优化其中一个变量δi\delta_i,而固定其它变量δj,ij\delta_j,i \neq j,得: 【?】是一只优化一个wiw_i还是一个δi\delta_i? 【?】如果是只优化一个wiw_i,为什么不能直接假设其它δj=0\delta_j=0? 【?】如果是只优化一个δi\delta_i,为什么算法6.1步骤2-(b)只更新一个wiw_i

  7. 拟牛顿法 算法没看懂

  8. 线性可分SVM 7.1.3存在性和w的唯一性没看懂

  9. 原始问题转换为对偶最优化问题 公式(5)代入公式(3)怎么得到公式(6)

  10. 训练误差分析 公式(5)怎么得到公式(6)

  11. 7.3.2 正定核 这一节从3开始就看不懂了,很多术语不懂 13."感知机学习算法的原始形式和对偶形式与第7章中支持向量机学习算法的原始形式和对偶形式相对应。" 感知机中的对偶与后面算法中的对偶是怎么对应的?

  12. [高斯混合模型的Q函数推导]过程有几一些地方没看懂(https://windmising.gitbook.io/lihang-tongjixuexifangfa/em/5)

  13. 9.4节,数据基础不够,看不懂。先去补补数学基础吧。

  14. 后向算法的初值是怎么来的?

Last updated

Was this helpful?