什么是信用風(fēng)險?
交易對手未能履行約定契約中的義務(wù)而造成經(jīng)濟損失的風(fēng)險,即受信人不能履行還本付息的責(zé)任而使授信人的預(yù)期收益與實際收益發(fā)生偏離的可能性,它是金融風(fēng)險的主要類型。
組成部分:
PD 違約概率
LGD 違約條件下的損失率
EAD 違約風(fēng)險下的敞口暴露
RWA 風(fēng)險權(quán)重資產(chǎn)
EL 期望損失
壞樣本的定義
? M3&M3+逾期
? 債務(wù)重組
? 個人破產(chǎn)
? 銀行主動關(guān)戶或注銷
? 其他相關(guān)違法行為
M0,M1,M2的定義
? M0:最后繳款日的第二天到下一個賬單日
? M1:M0時段的延續(xù),即在未還款的第二個賬單日到第二次賬單的最后繳款日之間
? M2:M1的延續(xù),即在未還款的第三個賬單日到第三次賬單的最后繳款日之間
什么是評分卡
信貸場景中的評分卡
? 以分數(shù)的形式來衡量風(fēng)險幾率的一種手段
? 是對未來一段時間內(nèi)違約/逾期/失聯(lián)概率的預(yù)測
? 有一個明確的(正)區(qū)間
? 通常分數(shù)越高越安全
? 數(shù)據(jù)驅(qū)動
? 反欺詐評分卡、申請評分卡、行為評分卡、催收評分卡
非信貸場景中的評分卡
? 推薦評分卡
? 流失評分卡
觀察期與表現(xiàn)期
觀察期
? 搜集變量、特征的時間窗口,通常3年以內(nèi)
? 帶時間切片的變量
表現(xiàn)期
? 搜集是否出發(fā)壞樣本定義的時間窗口,通常6個月~1年
評分卡模型開發(fā)步驟
立項
數(shù)據(jù)準備與預(yù)處理
模型構(gòu)建
模型評估
驗證/審計
模型部署
模型監(jiān)控
評分卡開發(fā)的常用模型
? 邏輯回歸
優(yōu)點: 簡單,穩(wěn)定,可解釋,技術(shù)成熟,易于監(jiān)測和部署
缺點: 準確度不高
? 決策樹
優(yōu)點: 對數(shù)據(jù)質(zhì)量要求低,易解釋
缺點: 準確度不高
? 其他元模型
? 組合模型
優(yōu)點: 準確度高,不易過擬合
缺點: 不易解釋;部署困難;計算量大
模型監(jiān)控的指標
AR
KS
PSI
Kendall’ Tau
Migration Matrix
AR(Accuracy Ratio)
衡量分數(shù)預(yù)測能力的指標 ,需要一個完整的表現(xiàn)期。取值位于-1~1之間。
如果我們今天用AR來監(jiān)控模型的好壞,那么只能是監(jiān)控模型在一年(這里假定表現(xiàn)期為一年)之前的數(shù)據(jù)上表現(xiàn)的好壞。
先把樣本按分數(shù)由低到高排序,X軸是總樣本的累積比例,Y軸是壞樣本占總的壞樣本的累積比例。AR就是等于模型在隨機模型之上的面積除以理想模型在隨機模型之上的面積。計算中可以用梯形近似逼近曲線下面積來計算,AR越高說明模型區(qū)分效果越好。
下圖公式中Xk,Yk代表分數(shù)的第K個分位點對應(yīng)的累積總樣本及相應(yīng)的壞樣本的比例。設(shè)總的壞樣本的比例為Bo,令(Xk,Yk)=(0,0)
KS(Kolmogorov-Smirnov)
衡量分數(shù)區(qū)分能力的指標。
把樣本按分數(shù)由低到高排序,X軸是總樣本累積比例,Y是累積好,壞樣本分別占總的好,壞樣本的比例。兩條曲線在Y軸方向上的相差最大值即KS。KS越大說明模型的區(qū)分能力越好。
Bad k和Good k分別表示為分數(shù)累積到第k個分位點的壞樣本個數(shù)和好樣本個數(shù),KS計算公式:?
PSI( Population Stablility Index)
衡量分數(shù)穩(wěn)定性的指標
按分數(shù)對人群進行分組,令Ri是現(xiàn)在樣本中第i組占總樣本的百分比,Bi是一段時間后第i個分組占總樣本的百分比。PSI取值越小說明分數(shù)的分布隨時間變化越小。
Kendall’s Tau
正確有效的評分卡模型中,低分數(shù)的實際逾期率應(yīng)該嚴格大于高分段的實際逾期率。我們將分數(shù)從低到高劃分為10組,每組的實際逾期率記做r1,r2,r3,…,r10。對所有的(ri,rj)的組合,如果有ri< rj且i< j,或者ri> rj且i> j,則記做一個discordant pair,否則記做concordant pair。其計算公式如下:
Kendall’s Tau越接近1或者等于1,說明逾期率在分數(shù)上的單調(diào)下降性越明顯,反之說明分數(shù)變化與逾期率的變化的一致性得不到保證。
Migration Matrix
遷移矩陣是衡量分數(shù)矩陣的指標,對相同的人群,觀察在相鄰兩次監(jiān)控日期(一周)分數(shù)的遷移變化。遷移矩陣中元素Mjk代表上次監(jiān)控日期分數(shù)在第j組中的人群在當前遷移到第k組的概率。實際計算中可把分數(shù)平均分成10組,計算這10組之間的遷移矩陣。
申請評分卡的重要性和特性
互聯(lián)網(wǎng)金融特性與產(chǎn)品
傳統(tǒng)金融機構(gòu)+非金融機構(gòu)
傳統(tǒng)金融機構(gòu): 傳統(tǒng)金融業(yè)務(wù)的互聯(lián)網(wǎng)創(chuàng)新以及電商化創(chuàng)新、APP軟件等
非金融機構(gòu):利用互聯(lián)網(wǎng)技術(shù)進行金融運作的電商企業(yè)
(P2P)模式的網(wǎng)絡(luò)借貸平臺
眾籌模式的網(wǎng)絡(luò)投資平臺
挖財類(模式)的手機理財APP(理財寶類)
第三方支付平臺等。
為什么要開發(fā)申請評分卡
風(fēng)險控制
營銷
資本管理
評分卡的特性
穩(wěn)定性
區(qū)分性
預(yù)測能力
和逾期概率等價(即評分和逾期率呈相關(guān)性)
申請評分卡常用的特征
個人信息 : 學(xué)歷 性別 收入
負債信息 : 在本金融機構(gòu)或者其他金融機構(gòu)負債情況
消費能力 : 商品購買紀錄,出境游,奢侈品消費
歷史信用記錄 : 歷史逾期行為
新興數(shù)據(jù) : 人際社交 網(wǎng)絡(luò)足跡 出行 個人財務(wù)
非平衡樣本問題的定義和解決方法
非平衡樣本的定義
在分類問題中,每種類別的出現(xiàn)概率未必均衡
信用風(fēng)險:正常用戶遠多于逾期/違約用戶
流失風(fēng)險: 留存客戶多于流失客戶
非平衡樣本的隱患
降低對少類樣本的靈敏性
非平衡樣本的解決方案
過采樣
優(yōu)點: 簡單,對數(shù)據(jù)質(zhì)量要求不高
缺點: 過擬合
欠采樣
優(yōu)點: 簡單,對數(shù)據(jù)質(zhì)量要求不高
缺點: 丟失重要信息
SMOTE(合成少數(shù)過采樣技術(shù))
優(yōu)點: 不易過擬合,保留信息
缺點: 不能對有缺失值和類別變量做處理