圖書簡介
風控領域是新興的機器學習應用場景之一,其特點包括了負樣本佔比極少、業務對模型解釋性要求偏高、業務模型多樣、風控數據源豐富等。
《智能風控:原理、算法與工程實踐》一書共 8 章,包含 26 種解決方案,分別介紹了自動化規則挖掘、集成模型評分卡、項目冷啟動、倖存者偏差、不均衡學習、異常檢測、模型優化、網絡挖掘等方向所面臨的問題,同時利用決策樹、集成學習、遷移學習、無監督學習、半監督學習、模型融合、深度學習、圖算法等機器學習模型對其進行改善,幫助讀者更好、更快地解決實際的建模問題。本書由機械工業出版社於2019年12月出版。
梅子行,男,歷任多家金融科技公司風控算法研究員、數據挖掘工程師等職位。現供職於智能物流獨角獸公司——滿幫科技。
師承Experian、Discover等風控專家。擅長深度學習、複雜網絡、遷移學習、異常檢測等非傳統機器學習方法。熱衷於數據挖掘以及算法的跨領域優化實踐。
圖書目錄
前言
第 1 章 風控建模與規則挖掘 / 1
1.1 信貸與風險 / 1
1.1.1 信貸業務與互聯網金融風控體系 / 1
1.1.2 信貸風險與控制 / 4
1.2 工業建模流程 / 5
1.2.1 抽象業務 / 6
1.2.2 定義標籤 / 6
1.2.3 樣本選取 / 7
1.2.4 特徵工程與模型調優 / 7
1.2.5 上線監控與評估報表 / 8
1.3 規則挖掘方案 / 11
1.4 本章小結 / 18
第 2 章 集成模型評分卡 / 19
2.1 特徵工程解析 / 19
2.1.1 特徵與模型 / 20
2.1.2 信用模型的特徵 / 20
2.2 特徵衍生方案 / 22
2.3 離散處理 / 24
2.3.1 one-hot編碼 / 25
2.3.2 WOE編碼 / 26
2.4 迭代特徵篩選方案 / 31
2.5 自動化調參 / 36
2.5.1 自動化調參策略 / 37
2.5.2 參數搜索方案 / 37
2.5.3 調參框架搭建 / 38
2.6 遞歸特徵刪除方案 / 41
2.7 評分卡製作 / 43
2.7.1 邏輯迴歸評分卡 / 43
2.7.2 集成模型的評分映射 / 53
2.8 本章小結 / 58
第 3 章 遷移學習與冷啟動 / 59
3.1 遷移學習基礎 / 59
3.1.1 應用場景 / 60
3.1.2 概念介紹 / 60
3.2 遷移學習方法論 / 61
3.2.1 三類常見算法 / 61
3.2.2 遷移的實現方法 / 62
3.3 少量有標籤樣本的遷移方案 / 63
3.3.1 TrAdaBoost模型 / 63
3.3.2 跨場景遷移模型 / 65
3.4 無標籤樣本遷移之 JDA / 74
3.4.1 JDA模型 / 74
3.4.2 模型應用 / 77
3.5 無標籤樣本遷移之 DTELM / 80
3.5.1 ELM模型 / 80
3.5.2 DTELM模型 / 81
3.5.3 模型應用 / 83
3.6 遷移樣本篩選方案 / 88
3.6.1 背景介紹 / 88
3.6.2 算法框架概覽 / 88
3.6.3 搭建融合框架 / 88
3.7 本章小結 / 93
第 4 章 倖存者偏差 / 94
4.1 倖存者偏差的含義 / 94
4.2 增量學習 / 95
4.3 生成對抗網絡 / 96
4.3.1 GAN模型介紹 / 97
4.3.2 GAN與倖存者偏差 / 98
4.4 高斯聚類模型 / 99
4.4.1 GMM算法原理 / 99
4.4.2 GMM簡單應用 / 102
4.4.3 GMM中的概率模型 / 102
4.4.4 GMM樣本生成 / 106
4.5 信息準則 / 108
4.5.1 赤池信息準則 / 109
4.5.2 貝葉斯信息準則 / 109
4.5.3 AIC與BIC比較 / 110
4.6 本章小結 / 111
第 5 章 不均衡學習 / 112
5.1 樣本不均衡 / 112
5.2 代價敏感加權方案 / 113
5.3 插值過採樣方案 / 114
5.3.1 SMOTE算法 / 114
5.3.2 過採樣算法實踐 / 115
5.4 半監督學習方案 / 120
5.4.1 前提假設 / 121
5.4.2 S3VM / 121
5.4.3 LP / 125
5.5 本章小結 / 129
第 6 章 異常檢測 / 130
6.1 離群點與欺詐檢測 / 130
6.2 z-score檢驗 / 131
6.3 LOF異常檢測法 / 132
6.3.1 原理與算法流程 / 132
6.3.2 LOF樣本清洗方案 / 134
6.4 IF異常檢測法 / 137
6.4.1 原理與算法流程 / 137
6.4.2 PreA模型與冷啟動 / 139
6.5 本章小結 / 141
第 7 章 模型優化 / 142
7.1 多損失函數分段預測 / 142
7.1.1 2種損失函數 / 143
7.1.2 融合流程 / 143
7.2 樹模型特徵衍生 / 145
7.2.1 GBDT離散化 / 146
7.2.2 融合方案詳解 / 146
7.2.3 特徵衍生細節 / 147
7.2.4 案例 / 148
7.3 時間序列建模 / 156
7.3.1 RNN / 157
7.3.2 LSTM / 160
7.3.3 門控結構 / 161
7.3.4 LSTM行為評分卡案例 / 163
7.4 高維稀疏數據建模 / 167
7.4.1 算法原理 / 167
7.4.2 算法應用 / 169
7.5 模型融合 / 171
7.5.1 模型融合基礎 / 171
7.5.2 模型篩選 / 172
7.6 本章小結 / 179
第 8 章 知識圖譜 / 180
8.1 複雜網絡基礎 / 180
8.2 中心度與相似性 / 183
8.3 節點分類 / 189
8.3.1 樸素節點分類 / 189
8.3.2 鄰節點加權投票 / 191
8.3.3 一致性標籤傳播 / 193
8.4 社區發現算法 / 196
8.4.1 基礎概念 / 196
8.4.2 Girvan-Newman算法 / 197
8.4.3 Louvain算法 / 199
8.4.4 社區評估 / 200
8.5 網絡表示學習 / 202
8.5.1 矩陣分解 / 203
8.5.2 節點嵌入 / 207
8.6 圖卷積神經網絡 / 211
8.6.1 卷積神經網絡 / 211
8.6.2 傅里葉變換 / 213
8.6.3 拉普拉斯算子 / 215
8.6.4 GCN中的圖卷積 / 217
8.6 本章小結 / 221
參考文獻 / 222
閱讀更多 薦書少年 的文章