东哥起飞 2025-02-13 12:03 浙江
信贷风控领域中,模型应用和规则的制定,常需要一个指标,就是AUC。本次来给大家详细ROC/AUC的概念、使用标准、以及Python代码实操,内容节选自?《100天风控专家》评估指标篇。
1、混淆矩阵
信贷业务中,风控模型大多是二分类模型,如果将预测表现与实际表现(目标变量Y[0,1])进行两两交叉,就会出现以下4种情况,这就是混淆矩阵(confusionmatrix)。
由于1和0数字混合在一起,阅读性不好,所以我们用换了符号(P/N)和(T/F)代替。这种表示方法可以这么简单的理解:先看①预测结果(P/N),再根据②实际表现对比预测结果,给出判断结果(T/F)。按这个顺序理解,这四种情况就很好记住了。
P(Positive):预测为正例(坏客户)
N(Negative):预测为负例(好客户)
T(True):预测正确
F(False):预测错误
TP:预测为P,实际为P,预测正确
FP:预测为P,实际为N,预测错误
FN:预测为N,实际为P,预测错误
TN:预测为N,实际为N,预测正确
2、准确率
既然是个分类指标,我们可以很自然的想到准确率,准确率的定义是预测正确的结果占总样本的百分比,公式:
准确率=(TP+TN)/(TP+TN+FP+FN)
虽然准确率可以判断总的正确率,但是在样本不平衡的情况下,并不能作为很好的指标来衡量结果。举个简单的例子,比如在一个总样本中,正样本占90%,负样本占10%,样本是严重不平衡的。对于这种情况,我们只需要将全部样本预测为正样本即可得到90%的高准确率,但实际上我们并没有很用心的分类,只是随便无脑一分而已。这就说明了:由于样本不平衡的问题,导致了得到的高准确率结果含有很大的水分。即如果样本不平衡,准确率就会失效。
3、精准率
精准率(Precision)又叫查准率,它是针对预测结果而言的,它的含义是在所有被预测为正的样本中实际为正的样本的概率,意思就是在预测为正样本的结果中,我们有多少把握可以预测正确,其公式如下:
精准率=TP/(TP+FP)
精准率和准确率看上去有些类似,但是完全不同的两个概念。精准率代表对正样本结果中的预测准确程度,而准确率则代表整体的预测准确程度,既包括正样本,也包括负样本。
4、召回率
召回率(Recall)又叫查全率,它是针对原样本而言的,它的含义是在实际为正的样本中被预测为正样本的概率,其公式如下:
召回率=TP/(TP+FN)
在信贷风控中,相对好用户,我们更关心坏用户,不能错放过任何一个坏用户。因为如果我们过多的将坏用户当成好用户,这样后续可能发生的违约金额会远超过好用户偿还的借贷利息金额,造成严重偿失。召回率表示总共100个坏客户中能识别出多少个,值越高代表实际坏用户被预测出来的概率越高,它的含义类似:宁可错杀一千,绝不放过一个。
5、P-R曲线
通过公式我们发现:精准率和召回率的分子是相同,都是TP,但分母是不同的,一个是(TP+FP),一个是(TP+FN)。
两者的关系可以用一个P-R(precision-recall)图来展示:
如何理解P-R 曲线?
P-R曲线遍历了从0到1之间的所有值作为阈值,而每个阈值都对应着一对精准率和召回率,从而就得到了这条曲线。逻辑回归模型输出结果为0到1,是一个排序结果,比如,我们定义阈值为0.5,即概率小于0.5的我们都认为是好用户,而大于0.5都认为是坏用户。因此,对于阈值为0.5的情况下,我们可以得到相应的一对精准率和召回率,对应P-R曲线上一个点。
6、F1分数
我们希望精准率和召回率同时都高,但实际上这两个指标是此消彼长的。P-R曲线图中明显看到,如果其中一个非常高,另一个肯定会非常低。选取合适的阈值点要根据实际需求,比如我们想要高的召回率,那就会牺牲一些精准率,要在保证召回率高的情况下,精准率也不那么低。
如果想要找到这样一个平衡点,需要一个新指标:F1分数。F1分数同时考虑了精准率和召回率,可以让二者同时达到最高,取一个平衡。其公式如下:
F1分数 = 2*精准率*召回率 / (精准率 + 召回率)
我们在图中看到的平衡点就是F1分数得来的结果
F1分数计算:
A点 =2*0.8*0.8/(0.8+0.8)=0.8
B点 = 2*0.9*0.7/(0.9+0.7)=0.7875
C点 = 2*0.4*0.95/(0.4+0.95)=0.5630
7、ROC曲线
1)真正率(TPR)、假正率(FPR)
ROC曲线是基于混淆矩阵的另外两个指标绘制而成,这两个指标是:真正率(TPR)、假正率(FPR)
真正率(TPR)= TP/(TP+FN) = 召回率
假正率(FPR)= FP/(FP+TN)
真正率(TPR)表示在总的坏客户中有多少被识别出来,越高越好,而假正率(FPR)表示有多少的负样本被错误地预测为正样本,越少越好。下面示意图,我们发现TPR和FPR分别是基于实际表现1和0出发的,分别从实际的正样本和负样本中来观察相关概率问题。正因如此,所以无论样本是否平衡,都不会被影响。所以可以看出:如果我们从实际表现的各个结果角度出发,就可以避免样本不平衡的问题了,这也是为什么选用TPR和FPR作为ROC曲线坐标的原因了。
2)认识ROC曲线图
与前面的P-R曲线类似,ROC曲线也是通过遍历所有阈值来绘制整条曲线的。横坐标是FPR,纵坐标是TPR。在这个曲线图中,随着TPR不断变大,FPR也不断变大。
遍历所有的阈值,则TPR和FPR不断变化,相应的,在ROC曲线图中也会沿着曲线滑动。
3)如何判断ROC曲线的好坏?
改变阈值只是不断地改变TPR和FPR,但是曲线本身是不会变的。那么如何判断一个模型的ROC曲线是好的呢?这个还是要回归到我们的本质:FPR表示模型“误杀”的程度,而TPR表示模型“抓坏”的程度。我们希望的是:误杀的越少越好,抓坏的越多越好。所以总结一下就是TPR越高,同时FPR越低(即ROC曲线越陡),那么模型的性能就越好。参考如下动态图进行理解。
4)ROC曲线的好处
前面已经对ROC曲线为什么可以无视样本不平衡做了解释,下面我们用动态图的形式再次展示一下它是如何工作的。我们发现:无论红蓝色样本比例如何改变,ROC曲线都没有影响。
8、AUC
AUC(AreaUnder Curve)就是ROC曲线下的面积。如果我们连接对角线,它的面积正好是0.5。对角线的实际含义是:随机判断(相当于盲猜),正负样本覆盖率应该都是50%,表示随机效果。正常来说,ROC曲线越陡越好,所以理想值就是1,一个正方形,而最差的随机判断都有0.5,所以一般AUC的值是介于0.5到1之间的。
AUC的一般判断标准:
0.50 - 0.70:效果较低
0.70 - 0.85:效果一般
0.85 - 0.95:效果很好
0.95 – 1.00:效果非常好,但一般不太可能
信贷业务中,根据具体场景AUC能达到的水平各不相同,比如贷中贷后一般至少在0.7以上。贷前模型如果能到0.7算是比较不错的效果了。
Python代码
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_true, df['xgb_pred']) # 计算真实标签和预测标签之间的混淆矩阵
mask = np.zeros_like(cm)
mask[np.triu_indices_from(mask,1)] = True
plt.style.use('classic')
plt.figure(facecolor='white',dpi=80)
sns.heatmap(cm, mask=mask, annot=True, fmt='.2f', linewidths=0.2)
plt.xlabel('y_true',fontsize=12)
plt.ylabel('y_pred',fontsize=12)
plt.title('Confusion Matrix', fontsize=14)
plt.show()
from sklearn.metrics import precision_recall_curve
from sklearn.metrics import average_precision_score
average_precision = average_precision_score(y_true, preds)
precision, recall, thres = precision_recall_curve(y_true, preds)
plt.style.use('classic')
plt.figure(facecolor='white',dpi=100)
plt.plot(recall, precision, color='#F59B00', alpha=1, label='PR curve (area = {:.2f})'.format(average_precision))
plt.fill_between(recall, precision, alpha=0.2, color='#F59B00')
plt.xlabel('Recall',fontsize=12)
plt.ylabel('Precision',fontsize=12)
plt.ylim([0.0, 1.01])
plt.xlim([0.0, 1.05])
plt.title('Precision-Recall curve', fontsize=14)
plt.legend(loc="best",fontsize=12)
fpr, tpr, _ = roc_curve(y, y_preds)
auc = round(roc_auc_score(y, y_preds), 4)
plt.style.use('classic')
plt.figure(facecolor='white',dpi=80)
plt.plot(fpr, tpr, label='{}_auc: '.format(datatype)+str(auc), color='red', linestyle='-', linewidth=1.5)
plt.fill_between(fpr, tpr, alpha=0.2, color='#F08080')
plt.plot([0,1], [0,1], 'k--')
plt.xlabel("FPR")
plt.ylabel("TPR")
plt.xlim(-0.01,1)
plt.ylim(0,1.01)
plt.title("ROC curve of %s (AUC = %.4f)" % (datatype, auc), fontsize=14)
plt.legend(fontsize=12, loc='best')
以上内容完整讲解和数据代码(真实业务数据+代码实操)参考?《100天风控专家》(共更新150期,涵盖业务、产品、策略、模型、数据等6大核心模块、10大专栏、共计60h以上)
--end--
以上内容节选自?《100天风控专家》