多类别分类中的宏平均和加权平均

前言

在处理多类别分类问题时，宏平均（Macro-average）和加权平均（Weighted-average）是评估模型性能时常用的两种聚合指标。它们都能将每个类别的独立指标（如精确率、召回率、F1分数等）整合成一个单一的全局指标，但处理方式有所不同，从而反映出模型性能的不同侧重。

宏平均（Macro-average）

宏平均是对所有类别的指标进行简单的算术平均。计算步骤如下：

独立计算每个类别的指标：

求取平均值：

宏平均（Macro-average）是一种用于评估多类别分类模型性能的指标计算方法，它通过对所有类别的指标（如精确率、召回率、F1值等）进行简单平均得到。宏平均的计算公式如下：假设模型有 C 个类别，对于每个类别（ = 1, 2, , C ），计算其对应的指标值（例如，精确率、召回率、F1值等）。宏平均的计算公式为：

$M_{\text{macro}} = \frac{1}{C} \sum_{i=1}^{C} M_i$

具体到不同的指标，宏平均的计算可以细分为：

宏平均精确率（Macro-Precision） ：

$P_{\text{macro}} = \frac{1}{C} \sum_{i=1}^{C} P_i$

其中是类别的精确率。

宏平均召回率（Macro-Recall） ：

$R_{\text{macro}} = \frac{1}{C} \sum_{i=1}^{C} R_i$

其中是类别的召回率。

宏平均F1值（Macro-F1） ：

$F1_{\text{macro}} = \frac{1}{C} \sum_{i=1}^{C} F1_i$

其中是类别的F1值，计算公式为：

$F1_i = 2 \cdot \frac{P_i \cdot R_i}{P_i R_i}$

特点：

平等对待每个类别：

适用于类别不平衡但不希望少数类别被“淹没”的情况：

对少数类别敏感：

示例：

假设有A、B、C三个类别，它们的F1分数分别为0.8、0.9、0.5。

宏F1分数 = (0.8+0.9+0.5)/3=0.733

加权平均（Weighted-average）

加权平均是对所有类别的指标进行加权算术平均，权重通常是每个类别在数据集中所占的样本数量比例。计算步骤如下：

独立计算每个类别的指标：

确定每个类别的权重：

加权求和：

加权平均的计算公式为：

$\text{加权平均} = \frac{\sum_{i=1}^{n} w_i \cdot x_i}{\sum_{i=1}^{n} w_i}$

其中：

特点：

考虑类别样本数量：

反映模型在整体数据集上的表现：

倾向于多数类别：

示例：

假设有A、B、C三个类别，F1分数分别为0.8、0.9、0.5，样本数量分别为100、200、50。

总样本数 = 100+200+50=350

A类权重 = 100/350≈0.286

B类权重 = 200/350≈0.571

C类权重 = 50/350≈0.143

加权F1分数 = (0.8×0.286)+(0.9×0.571)+(0.5×0.143)=0.2288+0.5139+0.0715≈0.8142

总结

宏平均和加权平均各有侧重，选择哪种平均方法取决于你对模型性能评估的优先级：

宏平均（Macro-average）：

所有类别是否都能得到良好预测

加权平均（Weighted-average）：

模型在整体数据分布上的预测准确性

前言

宏平均（Macro-average）

加权平均（Weighted-average）

总结

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签