最大似然估计算法过程
朴素贝叶斯算法
输入: 样本数据T,包含m个n维特征的样本。 aij为每个样本特征的第i个特征可取到的第j个值。 测试样本x 输出: 对x的预测分类。
计算先验概率
计算每个特征每个取值的条件概率
为当时,X第j个特征为的条件概率
计算假如时出现X=x的条件概率
对所有计算 为当时,x的每一个特征的条件概率的乘积。
计算当X=x时所有的后验概率的分子
以上公式中分子所有需要的内容都在以前已经计算出,代入公式即可 不需要计算分母。因为最终要用到的不是后验概率的具体数值,只是要比较大小。中所有C_k的后验概率公式,分母都是相同的,不影响大小的比较,所以不用计算出来。
确定x的分类
当X=x时所有的后验概率中分子取得最大概率的那即x的分类
代码
Last updated
Was this helpful?