模型评估 K-s曲线值变化有什么规律?
【摘要】K-s是模型验证的最常用的“武器”之一,而K-s曲线指洛伦兹曲线之间的差值。K-S曲线主要是验证模型的区分能力,通常是在模型预测全体样本的
K-S曲线主要是验证模型的区分能力,通常是在模型预测全体样本的信用评分后,将全体样本按违约与非违约分为两部分,然后用K-S统计量来检验这两组样本信用评分的分布是否有显著差异。
K-S曲线中的最大值被称为K-S统计量,其取值在0到1之间。如果是随机抽样,好人的洛伦兹曲线跟坏人的是重合的,K-S统计量为0。
K-S统计量越大,表示模型能够把“好”和“坏”区分开来的程度越大,而最理想的风控模型,K-S统计量的值为1。
K-S曲线实际上就是把阈值作为横坐标,TPR和FPR,也就是召回率和虚警率,其实也就是ROC曲线的那两个变量,同时作为纵坐标,随着阈值的变化,召回和虚警都从0到1,这时候,两者距离最远的地方就是KS值。当把虚警那条曲线拉直,然后让召回随着虚警也对应地变化,那么得到的其实就是ROC曲线。
上一篇:excel表格基本操作之从零开始学习
下一篇:有监督学习和无监督学习算法怎么理解?
就业培训申请领取
环球青藤
官方QQ群扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群
数据分析师相关文章推荐
|数据分析师最新文章推荐
最新文章
数据分析师各地入口
环球青藤官方微信服务平台
刷题看课 APP下载
免费直播 一键购课
代报名等人工服务
数据分析师热点排行
- 1 传统数据和大数据的区别
- 2 数据分析的8种方法都是哪些?
- 3 数据分析的具体流程是什么?
- 4 3大常用的数据分析工具是什么?
- 5 excel中的运算符
- 6 数据分析的作用有哪些?
- 7 电子商务需要分析哪些数据?
- 8 数据分析包括哪些内容?
- 9 数据分析的基本步骤
- 10 rdd是什么?