薦書|智能風控:原理、算法與工程實踐

薦書|智能風控:原理、算法與工程實踐

圖書簡介

風控領域是新興的機器學習應用場景之一,其特點包括了負樣本佔比極少、業務對模型解釋性要求偏高、業務模型多樣、風控數據源豐富等。

《智能風控:原理、算法與工程實踐》一書共 8 章,包含 26 種解決方案,分別介紹了自動化規則挖掘、集成模型評分卡、項目冷啟動、倖存者偏差、不均衡學習、異常檢測、模型優化、網絡挖掘等方向所面臨的問題,同時利用決策樹、集成學習、遷移學習、無監督學習、半監督學習、模型融合、深度學習、圖算法等機器學習模型對其進行改善,幫助讀者更好、更快地解決實際的建模問題。本書由機械工業出版社於2019年12月出版。

梅子行,男,歷任多家金融科技公司風控算法研究員、數據挖掘工程師等職位。現供職於智能物流獨角獸公司——滿幫科技。

師承Experian、Discover等風控專家。擅長深度學習、複雜網絡、遷移學習、異常檢測等非傳統機器學習方法。熱衷於數據挖掘以及算法的跨領域優化實踐。

圖書目錄

前言

第 1 章 風控建模與規則挖掘 / 1

1.1 信貸與風險 / 1

1.1.1 信貸業務與互聯網金融風控體系 / 1

1.1.2 信貸風險與控制 / 4

1.2 工業建模流程 / 5

1.2.1 抽象業務 / 6

1.2.2 定義標籤 / 6

1.2.3 樣本選取 / 7

1.2.4 特徵工程與模型調優 / 7

1.2.5 上線監控與評估報表 / 8

1.3 規則挖掘方案 / 11

1.4 本章小結 / 18

第 2 章 集成模型評分卡 / 19

2.1 特徵工程解析 / 19

2.1.1 特徵與模型 / 20

2.1.2 信用模型的特徵 / 20

2.2 特徵衍生方案 / 22

2.3 離散處理 / 24

2.3.1 one-hot編碼 / 25

2.3.2 WOE編碼 / 26

2.4 迭代特徵篩選方案 / 31

2.5 自動化調參 / 36

2.5.1 自動化調參策略 / 37

2.5.2 參數搜索方案 / 37

2.5.3 調參框架搭建 / 38

2.6 遞歸特徵刪除方案 / 41

2.7 評分卡製作 / 43

2.7.1 邏輯迴歸評分卡 / 43

2.7.2 集成模型的評分映射 / 53

2.8 本章小結 / 58

第 3 章 遷移學習與冷啟動 / 59

3.1 遷移學習基礎 / 59

3.1.1 應用場景 / 60

3.1.2 概念介紹 / 60

3.2 遷移學習方法論 / 61

3.2.1 三類常見算法 / 61

3.2.2 遷移的實現方法 / 62

3.3 少量有標籤樣本的遷移方案 / 63

3.3.1 TrAdaBoost模型 / 63

3.3.2 跨場景遷移模型 / 65

3.4 無標籤樣本遷移之 JDA / 74

3.4.1 JDA模型 / 74

3.4.2 模型應用 / 77

3.5 無標籤樣本遷移之 DTELM / 80

3.5.1 ELM模型 / 80

3.5.2 DTELM模型 / 81

3.5.3 模型應用 / 83

3.6 遷移樣本篩選方案 / 88

3.6.1 背景介紹 / 88

3.6.2 算法框架概覽 / 88

3.6.3 搭建融合框架 / 88

3.7 本章小結 / 93

第 4 章 倖存者偏差 / 94

4.1 倖存者偏差的含義 / 94

4.2 增量學習 / 95

4.3 生成對抗網絡 / 96

4.3.1 GAN模型介紹 / 97

4.3.2 GAN與倖存者偏差 / 98

4.4 高斯聚類模型 / 99

4.4.1 GMM算法原理 / 99

4.4.2 GMM簡單應用 / 102

4.4.3 GMM中的概率模型 / 102

4.4.4 GMM樣本生成 / 106

4.5 信息準則 / 108

4.5.1 赤池信息準則 / 109

4.5.2 貝葉斯信息準則 / 109

4.5.3 AIC與BIC比較 / 110

4.6 本章小結 / 111

第 5 章 不均衡學習 / 112

5.1 樣本不均衡 / 112

5.2 代價敏感加權方案 / 113

5.3 插值過採樣方案 / 114

5.3.1 SMOTE算法 / 114

5.3.2 過採樣算法實踐 / 115

5.4 半監督學習方案 / 120

5.4.1 前提假設 / 121

5.4.2 S3VM / 121

5.4.3 LP / 125

5.5 本章小結 / 129

第 6 章 異常檢測 / 130

6.1 離群點與欺詐檢測 / 130

6.2 z-score檢驗 / 131

6.3 LOF異常檢測法 / 132

6.3.1 原理與算法流程 / 132

6.3.2 LOF樣本清洗方案 / 134

6.4 IF異常檢測法 / 137

6.4.1 原理與算法流程 / 137

6.4.2 PreA模型與冷啟動 / 139

6.5 本章小結 / 141

第 7 章 模型優化 / 142

7.1 多損失函數分段預測 / 142

7.1.1 2種損失函數 / 143

7.1.2 融合流程 / 143

7.2 樹模型特徵衍生 / 145

7.2.1 GBDT離散化 / 146

7.2.2 融合方案詳解 / 146

7.2.3 特徵衍生細節 / 147

7.2.4 案例 / 148

7.3 時間序列建模 / 156

7.3.1 RNN / 157

7.3.2 LSTM / 160

7.3.3 門控結構 / 161

7.3.4 LSTM行為評分卡案例 / 163

7.4 高維稀疏數據建模 / 167

7.4.1 算法原理 / 167

7.4.2 算法應用 / 169

7.5 模型融合 / 171

7.5.1 模型融合基礎 / 171

7.5.2 模型篩選 / 172

7.6 本章小結 / 179

第 8 章 知識圖譜 / 180

8.1 複雜網絡基礎 / 180

8.2 中心度與相似性 / 183

8.3 節點分類 / 189

8.3.1 樸素節點分類 / 189

8.3.2 鄰節點加權投票 / 191

8.3.3 一致性標籤傳播 / 193

8.4 社區發現算法 / 196

8.4.1 基礎概念 / 196

8.4.2 Girvan-Newman算法 / 197

8.4.3 Louvain算法 / 199

8.4.4 社區評估 / 200

8.5 網絡表示學習 / 202

8.5.1 矩陣分解 / 203

8.5.2 節點嵌入 / 207

8.6 圖卷積神經網絡 / 211

8.6.1 卷積神經網絡 / 211

8.6.2 傅里葉變換 / 213

8.6.3 拉普拉斯算子 / 215

8.6.4 GCN中的圖卷積 / 217

8.6 本章小結 / 221

參考文獻 / 222


分享到:


相關文章: