机器学习算法评价指标

线性回归算法的评测

衡量标准

i=1m(ytest(i)y^test(i))2 \sum_{i=1}^m(y_{test}^{(i)} - \hat{y}{_{test}^{(i)}})^2 i=1∑m​(ytest(i)​−y^​test(i)​)2

方差与m的大小有关,例如第一个算法测试100个数据,累计误差为1000,第二个算法测试10000个数据,累计误差为99999, 如果我们仅以这个式子求出的累计误差大小衡量算法的优劣,显然是不合理的,所以我们需要让这个式子与测试数据的数量无关,所以引入均方误差MSE(Mean Squared Error)

1mi=1m(ytest(i)y^test(i))2 \frac{1}{m} \cdot \sum_{i=1}^m(y_{test}^{(i)} - \hat{y}{_{test}^{(i)}})^2 m1​⋅i=1∑m​(ytest(i)​−y^​test(i)​)2

但是我们对 y 进行了平方,导致量纲与实际不一致,因此又引入了均方根误差RMSE(Root Mean Squared Error)

1mi=1m(ytest(i)y^test(i))2=MSEtest \sqrt{\frac{1}{m} \cdot \sum_{i=1}^m(y_{test}^{(i)} - \hat{y}{_{test}^{(i)}})^2} = \sqrt{MSE_{test}} m1​⋅i=1∑m​(ytest(i)​−y^​test(i)​)2​=MSEtest​

平均绝对误差MAE(Mean Absolute Error)

1mi=1mytest(i)y^test \frac{1}{m} \cdot \sum_{i=1}^m|y_{test}^{(i)} - \hat{y}{_{test}}| m1​⋅i=1∑m​∣ytest(i)​−y^​test​∣

我们的目标函数不会定义为绝对值的形式,因为它不是处处可导,但是它可以用来评价我们的线性回归算法,所以评价一个算法的标准可以与目标函数不同。

R 方

 R Squared R2=1i(y^(i)y(i))2ii(yˉy(i))2=1(i=1im(y^(i)y(i))2)/m(i=1m(y(i)yˉ)2)/m=1MSE(y^,y)Var(y) \begin{array}{c}\text { R Squared } \\[5mm] \qquad \begin{aligned} R^{2}=1-\frac{\sum_{i}\left(\hat{y}^{(i)}-y^{(i)}\right)^{2}}{\sum_{i}^{i}\left(\bar{y}-y^{(i)}\right)^{2}} &=1-\frac{\left(\sum_{i=1}^{i_{m}}\left(\hat{y}^{(i)}-y^{(i)}\right)^{2}\right) / m}{\left(\sum_{i=1}^{m}\left(y^{(i)}-\bar{y}\right)^{2}\right) / m} \\[10mm] &=1-\frac{M S E(\hat{y}, y)}{\operatorname{Var}(y)} \end{aligned} \end{array}  R Squared R2=1−∑ii​(yˉ​−y(i))2∑i​(y^​(i)−y(i))2​​=1−(∑i=1m​(y(i)−yˉ​)2)/m(∑i=1im​​(y^​(i)−y(i))2)/m​=1−Var(y)MSE(y^​,y)​​​

首先抛出问题,当我们的算法用于预测不同的线性回归问题时,其评价结果可能非常不同,例如预测房价的时候误差为几万,预测考试成绩的时候误差是几分,这样比较几万和几分就没有可比性,这就是RMSE和 RAE的局限性,因此引出 分类的准确度 :1 最好, 0 最差

R2=1SSresidalSStotalR2=1i(y^(i)y(i))2i(yˉy(i))2 \begin{aligned} R^{2}=1-\frac{S S_{\text {residal}}}{S S_{\text {total}}} \\[5mm] R^{2}=1-\frac{\sum_{i}\left(\hat{y}^{(i)} \cdot^{\left.-y^{(i)}\right)^{2}}\right.}{\sum_{i}\left(\bar{y}-y^{(i)}\right)^{2}} \end{aligned} R2=1−SStotal​SSresidal​​R2=1−∑i​(yˉ​−y(i))2∑i​(y^​(i)⋅−y(i))2​​

分子是使用我们训练的模型的预测无擦,分母是用baseline model的预测结果

机器学习算法评价指标机器学习算法评价指标 xingyze 发布了20 篇原创文章 · 获赞 5 · 访问量 7204 私信 关注
上一篇:阿里云服务器1核1G内存1M带宽能放几个网站及多少流量


下一篇:非参数检验