5-6 最好的衡量线性回归法的指标 R Squared

分类问题使用accuracy来评价分类结果。 1最好，0最差。即使分类的问题不同，也能很容易的比较它们之间的优劣。

但RMSE和MAE无些特性。解决方法：R Squared

R Squared

R^2 = 1 - \frac {SS_{residual}}{SS_{total}} = 1 - \frac{\sum_i(\hat y^{(i)}- y^{(i)})^2}{\sum_i(\bar y- y^{(i)})^2}

说明：

$SS_{residual}$ : 使用模型预测产生的错误 $SS_{total}$ : 把所有样本都预测为 $\bar y$ 产生的错误 $\bar y$ ：y的平均值 $\hat y^{(i)}$ ：第i个样本的模型预测值

R Squared代表我们的模型拟合住的数据

R Squared的性质：

R Squared也可以写成这种形式：其中Var(y)代表方差

继续使用5-4中的数据和训练结果

1 - mean_squared_error(y_test, y_predict)/np.var(y_test)

或

from sklearn.metrics import r2_score
r2_score(y_test, y_predict)

Last updated 5 years ago