sklearn计算准确率、精确率、召回率、F1 score(宏平均 微平均)

混淆矩阵

sklearn计算准确率、精确率、召回率、F1 score(宏平均 微平均)

混淆矩阵见:我的博客

准确率

import numpy as np
from sklearn.metrics import accuracy_score

y_pred = [0, 2, 1, 3]
y_true = [0, 1, 2, 3]
print(accuracy_score(y_true, y_pred))  
print(accuracy_score(y_true, y_pred, normalize=False))  

# 在具有二元标签指示符的多标签分类案例中
print(accuracy_score(np.array([[0, 1], [1, 1]]), np.ones((2, 2))))  

精准率

实际为正样本占被预测为正的样本的比例
sklearn计算准确率、精确率、召回率、F1 score(宏平均 微平均)

y_true = [0, 1, 2, 0, 1, 2]
y_pred = [0, 2, 1, 0, 0, 1]

from sklearn.metrics import precision_score

print(precision_score(y_true, y_pred, average='macro'))  
print(precision_score(y_true, y_pred, average='micro')) 
print(precision_score(y_true, y_pred, average='weighted')) 
print(precision_score(y_true, y_pred, average=None))    

召回率

from sklearn.metrics import recall_score

print(recall_score(y_true, y_pred, average='macro'))
print(recall_score(y_true, y_pred, average='micro')) 
print(recall_score(y_true, y_pred, average='weighted'))  
print(recall_score(y_true, y_pred, average=None))  

F1

sklearn计算准确率、精确率、召回率、F1 score(宏平均 微平均)

from sklearn.metrics import f1_score

print(f1_score(y_true, y_pred, average='macro')) 
print(f1_score(y_true, y_pred, average='micro')) 
print(f1_score(y_true, y_pred, average='weighted'))  
print(f1_score(y_true, y_pred, average=None))  

Macro Average & Micro Average

  • Macro Average

宏平均是指在计算均值时使每个类别具有相同的权重,最后结果是每个类别的指标的算术平均值。

  • Micro Average

微平均是指计算多分类指标时赋予所有类别的每个样本相同的权重,将所有样本合在一起计算各个指标。

  1. 如果每个类别的样本数量差不多,那么宏平均和微平均没有太大差异
  2. 如果每个类别的样本数量差异很大,那么注重样本量多的类时使用微平均,注重样本量少的类时使用宏平均
  3. 如果微平均大大低于宏平均,那么检查样本量多的类来确定指标表现差的原因
  4. 如果宏平均大大低于微平均,那么检查样本量少的类来确定指标表现差的原因

参考:参考博客

上一篇:Python3 标准库概览


下一篇:LeetCode 805 Split Array With Same Average (推荐 预处理 类01背包dp 详解 640ms -> 16ms)