在信貸風控領域,隨著大數據、計算機集群技術、網絡技術和人工智能的發展,越來越多的金融機構將傳統的策略風控手段轉向依賴機器學習模型等量化手段。信貸環節中的審批、預警、催收以及營銷等諸多場景也適合機器學習模型的應用。機器學習模型的發展離不開數學、統計、概率、計算機理論等基礎知識。本課程將從較為基礎的統計和概率入手,展現如何從從基礎知識入門進而掌握較為先進的機器學習模型,從而構建簡單但實用的風控模型。
第一部份:初等概率論
1) 離散隨機變量與離散分布
2) 連續隨機變量與連續分布
3) 條件概率與貝葉斯公式
4) 馬爾科夫矩陣
5) 案例:信貸違約的轉移矩陣
第二部份:初等統計理論
1) 假設檢驗
2) 參數估計
3) 線性回歸
4) 案例:性別對信貸違約的影響
第三部份:數據分析師的養成計劃
1) 業務背景
2) 數據搜集與整理
3) 數據可視化與數據報表
4) 案例:信貸違約預測中的數據可視化
第四部份:python的介紹和入門
1) python語法
2) pandas,numpy,statsmodels,sklearn等常用包
3) 案例:pandas中的數據切片
第五部份:時間序列模型的應用
1) AR模型
2) MA模型
3) ARIMA模型
4) 其他常見的時間序列模型
5) 案例:從股票收益率的預測說起
第六部份:廣義線性回歸
1) 泊松回歸
2) 邏輯回歸
3) 案例:預測違約發生事件數
第七部份:分類場景之決策樹與隨機森林
1) 分類樹的基本概念
2) 如何控制模型過擬合
3) 回歸樹的基本概念
4) 隨機森林
5) 案例:信用卡的欺詐識別
第八部份:分類場景之支持向量機
1) 從線性可分說起
2) 對偶問題
3) 巧妙的核函數
4) 軟間隔:妥協的藝術
5) SMO算法詳解
6) 案例:信用卡的欺詐識別
第九部份:聚類場景之K均值聚類與K鄰近聚類
1) K均值聚類:物以類聚、人以群分
2) K鄰近聚類:近朱者赤、近墨者黑
3) 案例:信貸客群的聚類分析
第十部份:一統江湖之神經網絡模型與深度學習模型
1) 神經網絡模型的基本框架
2) 反向傳播算法
3) 深度學習模型
4) TensorFlow的使用
5) 案例:信用卡的欺詐識別
第十一部份:模型性能評估
1) 回歸模型的精度刻畫
2) 分類模型的精度刻畫
3) 案例:信用卡的欺詐識別
第十二部份:走近經典
1) EM算法
2) MCMC算法
3) 主成分分析
4) 案例:信用卡的欺詐識別模型中的降維
第十三部份:被忽視的也是重要的
1) 數據質量檢驗
2) 特征工程
3) 案例:信用卡的欺詐識別
|