日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

利用Python計算KS的實例詳解

瀏覽:188日期:2022-08-04 15:15:57

在金融領域中,我們的y值和預測得到的違約概率剛好是兩個分布未知的兩個分布。好的信用風控模型一般從準確性、穩定性和可解釋性來評估模型。

一般來說。好人樣本的分布同壞人樣本的分布應該是有很大不同的,KS正好是有效性指標中的區分能力指標:KS用于模型風險區分能力進行評估,KS指標衡量的是好壞樣本累計分布之間的差值。

好壞樣本累計差異越大,KS指標越大,那么模型的風險區分能力越強。

1、crosstab實現,計算ks的核心就是好壞人的累積概率分布,我們采用pandas.crosstab函數來計算累積概率分布。

2、roc_curve實現,sklearn庫中的roc_curve函數計算roc和auc時,計算過程中已經得到好壞人的累積概率分布,同時我們利用sklearn.metrics.roc_curve來計算ks值

3、ks_2samp實現,調用stats.ks_2samp()函數來計算。鏈接scipy.stats.ks_2samp¶為ks_2samp()實現源碼,這里實現了詳細過程

4、直接調用stats.ks_2samp()計算ks

import pandas as pd import numpy as npfrom sklearn.metrics import roc_curvefrom scipy.stats import ks_2samp def ks_calc_cross(data,pred,y_label): ’’’ 功能: 計算KS值,輸出對應分割點和累計分布函數曲線圖 輸入值: data: 二維數組或dataframe,包括模型得分和真實的標簽 pred: 一維數組或series,代表模型得分(一般為預測正類的概率) y_label: 一維數組或series,代表真實的標簽({0,1}或{-1,1}) 輸出值: ’ks’: KS值,’crossdens’: 好壞客戶累積概率分布以及其差值gap ’’’ crossfreq = pd.crosstab(data[pred[0]],data[y_label[0]]) crossdens = crossfreq.cumsum(axis=0) / crossfreq.sum() crossdens[’gap’] = abs(crossdens[0] - crossdens[1]) ks = crossdens[crossdens[’gap’] == crossdens[’gap’].max()] return ks,crossdens def ks_calc_auc(data,pred,y_label): ’’’ 功能: 計算KS值,輸出對應分割點和累計分布函數曲線圖 輸入值: data: 二維數組或dataframe,包括模型得分和真實的標簽 pred: 一維數組或series,代表模型得分(一般為預測正類的概率) y_label: 一維數組或series,代表真實的標簽({0,1}或{-1,1}) 輸出值: ’ks’: KS值 ’’’ fpr,tpr,thresholds= roc_curve(data[y_label[0]],data[pred[0]]) ks = max(tpr-fpr) return ks def ks_calc_2samp(data,pred,y_label): ’’’ 功能: 計算KS值,輸出對應分割點和累計分布函數曲線圖 輸入值: data: 二維數組或dataframe,包括模型得分和真實的標簽 pred: 一維數組或series,代表模型得分(一般為預測正類的概率) y_label: 一維數組或series,代表真實的標簽({0,1}或{-1,1}) 輸出值: ’ks’: KS值,’cdf_df’: 好壞客戶累積概率分布以及其差值gap ’’’ Bad = data.loc[data[y_label[0]]==1,pred[0]] Good = data.loc[data[y_label[0]]==0, pred[0]] data1 = Bad.values data2 = Good.values n1 = data1.shape[0] n2 = data2.shape[0] data1 = np.sort(data1) data2 = np.sort(data2) data_all = np.concatenate([data1,data2]) cdf1 = np.searchsorted(data1,data_all,side=’right’)/(1.0*n1) cdf2 = (np.searchsorted(data2,data_all,side=’right’))/(1.0*n2) ks = np.max(np.absolute(cdf1-cdf2)) cdf1_df = pd.DataFrame(cdf1) cdf2_df = pd.DataFrame(cdf2) cdf_df = pd.concat([cdf1_df,cdf2_df],axis = 1) cdf_df.columns = [’cdf_Bad’,’cdf_Good’] cdf_df[’gap’] = cdf_df[’cdf_Bad’]-cdf_df[’cdf_Good’] return ks,cdf_df data = {’y_label’:[1,1,1,1,1,1,0,0,0,0,0,0], ’pred’:[0.5,0.6,0.7,0.6,0.6,0.8,0.4,0.2,0.1,0.4,0.3,0.9]} data = pd.DataFrame(data)ks1,crossdens=ks_calc_cross(data,[’pred’], [’y_label’]) ks2=ks_calc_auc(data,[’pred’], [’y_label’]) ks3=ks_calc_2samp(data,[’pred’], [’y_label’]) get_ks = lambda y_pred,y_true: ks_2samp(y_pred[y_true==1], y_pred[y_true!=1]).statisticks4=get_ks(data[’pred’],data[’y_label’])print(’KS1:’,ks1[’gap’].values)print(’KS2:’,ks2)print(’KS3:’,ks3[0])print(’KS4:’,ks4)

輸出結果:

KS1: [ 0.83333333]KS2: 0.833333333333KS3: 0.833333333333KS4: 0.833333333333

當數據中存在NAN數據時,有一些問題需要注意!

例如,我們在原數據中增加了y_label=0,pred=np.nan這樣一組數據

data = {’y_label’:[1,1,1,1,1,1,0,0,0,0,0,0,0],’pred’:[0.5,0.6,0.7,0.6,0.6,0.8,0.4,0.2,0.1,0.4,0.3,0.9,np.nan]}

此時執行

ks1,crossdens=ks_calc_cross(data,[’pred’], [’y_label’])

輸出結果

KS1: [ 0.83333333]

執行

ks2=ks_calc_auc(data,[’pred’], [’y_label’])

將會報以下錯誤

ValueError: Input contains NaN, infinity or a value too large for dtype(’float64’).

執行

ks3=ks_calc_2samp(data,[’pred’], [’y_label’])

輸出結果

KS3: 0.714285714286

執行

ks4=get_ks(data[’pred’],data[’y_label’])

輸出結果

KS4: 0.714285714286

我們從上述結果中可以看出

三種方法計算得到的ks值均不相同。

ks_calc_cross計算時忽略了NAN,計算得到了數據正確的概率分布,計算的ks與我們手算的ks相同

ks_calc_auc函數由于內置函數無法處理NAN值,直接報錯了,所以如果需要ks_calc_auc計算ks值時,需要提前去除NAN值。

ks_calc_2samp計算得到的ks因為searchsorted()函數(有興趣的同學可以自己模擬數據看下這個函數),會將Nan值默認排序為最大值,從而改變了數據的原始累積分布概率,導致計算得到的ks和真實的ks有誤差。

總結

在實際情況下,我們一般計算違約概率的ks值,這時是不存在NAN值的。所以以上三種方法計算ks值均可。但是當我們計算單變量的ks值時,有時數據質量不好,存在NAN值時,繼續采用ks_calc_auc和ks_calc_2samp就會存在問題。

解決辦法有兩個

1. 提前去除數據中的NAN值

2. 直接采用ks_calc_cross計算。

以上這篇利用Python計算KS的實例詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
91九色综合| 国产美女久久| 免费一区二区三区在线视频| 国产精品一区二区精品| 国产精品网在线观看| 国产精品jk白丝蜜臀av小说| 国产精品视频一区二区三区四蜜臂| 97久久中文字幕| 欧美精品影院| 久久av国产紧身裤| 超碰在线99| 亚洲性色视频| 国产偷自视频区视频一区二区| zzzwww在线看片免费| 亚洲va中文在线播放免费| 欧美成人国产| 男女性色大片免费观看一区二区 | 午夜精品婷婷| 蜜臀av一区二区在线免费观看 | 亚洲精品欧洲| 久久精品国产免费| 高清不卡一区| 视频一区免费在线观看| 国产精品s色| 亚洲一级少妇| 男人的天堂亚洲一区| 久久婷婷国产| 亚洲深夜av| 欧美精品99| 欧美日韩国产探花| 欧美日韩在线精品一区二区三区激情综合 | 免费不卡中文字幕在线| 中文字幕av一区二区三区四区| 国产精品中文字幕制服诱惑| 国产在线|日韩| 日本va欧美va精品| 成人免费网站www网站高清| 亚洲免费影院| 高清在线一区| 日韩一区二区三区免费视频| 国产精品13p| 亚洲精品大全| 亚洲一级少妇| 日本午夜精品久久久久| 乱一区二区av| 久久国产精品久久久久久电车| 韩日一区二区| 97se亚洲| 红桃视频国产精品| 精品视频在线一区二区在线| 鲁大师成人一区二区三区| 高潮久久久久久久久久久久久久| 亚洲精品高潮| 99xxxx成人网| av在线资源| 国产精品激情| 亚洲精品国模| 午夜免费一区| 91偷拍一区二区三区精品| 免费国产自线拍一欧美视频| 久久影院一区二区三区| 亚洲尤物av| 国产一在线精品一区在线观看| 精品淫伦v久久水蜜桃| 欧美一级二级三级视频| 欧美在线综合| 久久国产成人午夜av影院宅| 国产精品三级| 日韩欧美三区| 国产亚洲精品自拍| 宅男在线一区| 伊伊综合在线| 国产精品a久久久久| 热久久久久久| 亚洲精品成人| 中文字幕色婷婷在线视频| 欧美亚洲一级| 蜜桃视频一区二区| 精品一区毛片| 国产一区二区三区视频在线| 国产乱码精品一区二区三区四区 | 久久精品xxxxx| 欧美日韩四区| 成人一区而且| 久久五月天小说| 欧美激情国产在线| 国产欧美88| 日韩av午夜在线观看| 久久久9色精品国产一区二区三区| 免费一级欧美在线观看视频| 亚洲精品乱码久久久久久蜜桃麻豆 | 久久不见久久见免费视频7| 国产亚洲毛片| 91精品国产调教在线观看| 中文在线资源| 久久久一二三| 国产精品主播在线观看| 欧美三区不卡| 国产精品一区高清| 国产伦精品一区二区三区千人斩| 亚洲美女91| 日韩va亚洲va欧美va久久| 日韩中文字幕亚洲一区二区va在线| 狠狠爱www人成狠狠爱综合网| 午夜免费一区| 综合亚洲视频| 国产精品日本一区二区不卡视频 | 免费看的黄色欧美网站| 黄色成人精品网站| 欧美xxxx中国| 中文字幕色婷婷在线视频| av日韩中文| 国产亚洲一区二区手机在线观看| 亚洲福利精品| 美女网站久久| 国产欧美日韩精品一区二区三区| 国产精品啊啊啊| 91精品韩国| 国产精品美女久久久| 最新国产精品视频| 欧美成人一二区| 欧美日韩国产观看视频| 樱桃成人精品视频在线播放| 亚洲精品字幕| 亚洲精品影院在线观看| 国产欧美三级| 水蜜桃精品av一区二区| 久久中文字幕av| 中文不卡在线| 久久精品国产999大香线蕉| 日韩电影免费网站| 欧美日韩视频| 日韩av中文字幕一区二区| 国产伊人久久| 国产农村妇女精品一二区| 国产欧美日韩在线观看视频| 一区二区三区四区日本视频| 9色精品在线| 久久av免费看| 麻豆网站免费在线观看| 9国产精品视频| 国产精品麻豆成人av电影艾秋 | 久久这里只有精品一区二区| 92国产精品| 在线一区二区三区视频| 国产精品入口久久| 亚洲高清久久| 日韩av一区二区三区四区| a国产在线视频| 美女黄网久久| 精品久久影院| 久久国产福利| 日本色综合中文字幕| 成人在线免费观看91| 免费在线观看精品| 午夜av成人| 国产精一区二区| 激情91久久| 成人在线免费观看91| 日本不卡在线视频| 国内亚洲精品| 国产精品宾馆| 免费日本视频一区| 久久精品国语| 国产精品久久久久毛片大屁完整版| 久久国产电影| 欧美激情日韩| 欧美丝袜一区| 精品日本视频| 亚州av日韩av| 久久国产电影| 国产一区二区三区精品在线观看| 午夜一级在线看亚洲| 五月天av在线| 欧美成a人片免费观看久久五月天| 激情婷婷久久| 97精品久久| 免费观看久久久4p| av在线资源| 国产欧美在线观看免费| 婷婷激情图片久久| 精品九九久久| 免费日韩视频| 国产精品视频3p| 欧美日韩视频| 岛国av在线网站| 欧美久久香蕉| 另类国产ts人妖高潮视频| 国产精品视频首页| 日本aⅴ精品一区二区三区 | 麻豆成人综合网| 91精品麻豆| 日本麻豆一区二区三区视频| 国产亚洲一级| 国产aⅴ精品一区二区四区| 国产精品99久久免费| 国产亚洲精品美女久久| 亚洲色图网站| 欧美日韩国产免费观看 | 国产一区丝袜|