2019-12-21 00:12:52 薦書少年

圖書簡介

風控領域是新興的機器學習應用場景之一，其特點包括了負樣本佔比極少、業務對模型解釋性要求偏高、業務模型多樣、風控數據源豐富等。

《智能風控：原理、算法與工程實踐》一書共 8 章，包含 26 種解決方案，分別介紹了自動化規則挖掘、集成模型評分卡、項目冷啟動、倖存者偏差、不均衡學習、異常檢測、模型優化、網絡挖掘等方向所面臨的問題，同時利用決策樹、集成學習、遷移學習、無監督學習、半監督學習、模型融合、深度學習、圖算法等機器學習模型對其進行改善，幫助讀者更好、更快地解決實際的建模問題。本書由機械工業出版社於2019年12月出版。

梅子行，男，歷任多家金融科技公司風控算法研究員、數據挖掘工程師等職位。現供職於智能物流獨角獸公司——滿幫科技。

師承Experian、Discover等風控專家。擅長深度學習、複雜網絡、遷移學習、異常檢測等非傳統機器學習方法。熱衷於數據挖掘以及算法的跨領域優化實踐。

圖書目錄

前言

第 1 章　風控建模與規則挖掘 / 1

1.1　信貸與風險 / 1

1.1.1　信貸業務與互聯網金融風控體系　/ 1

1.1.2　信貸風險與控制　/ 4

1.2　工業建模流程 / 5

1.2.1　抽象業務　/ 6

1.2.2　定義標籤　/ 6

1.2.3　樣本選取　/ 7

1.2.4　特徵工程與模型調優　/ 7

1.2.5　上線監控與評估報表　/ 8

1.3　規則挖掘方案 / 11

1.4　本章小結 / 18

第 2 章　集成模型評分卡 / 19

2.1　特徵工程解析 / 19

2.1.1　特徵與模型　/ 20

2.1.2　信用模型的特徵　/ 20

2.2　特徵衍生方案 / 22

2.3　離散處理 / 24

2.3.1 one-hot編碼　/ 25

2.3.2 WOE編碼　/ 26

2.4　迭代特徵篩選方案 / 31

2.5　自動化調參 / 36

2.5.1　自動化調參策略　/ 37

2.5.2　參數搜索方案　/ 37

2.5.3　調參框架搭建　/ 38

2.6　遞歸特徵刪除方案 / 41

2.7　評分卡製作 / 43

2.7.1　邏輯迴歸評分卡　/ 43

2.7.2　集成模型的評分映射　/ 53

2.8　本章小結 / 58

第 3 章　遷移學習與冷啟動 / 59

3.1　遷移學習基礎 / 59

3.1.1　應用場景　/ 60

3.1.2　概念介紹　/ 60

3.2　遷移學習方法論 / 61

3.2.1　三類常見算法　/ 61

3.2.2　遷移的實現方法　/ 62

3.3　少量有標籤樣本的遷移方案 / 63

3.3.1 TrAdaBoost模型　/ 63

3.3.2　跨場景遷移模型　/ 65

3.4　無標籤樣本遷移之 JDA / 74

3.4.1 JDA模型　/ 74

3.4.2　模型應用　/ 77

3.5　無標籤樣本遷移之 DTELM / 80

3.5.1 ELM模型　/ 80

3.5.2 DTELM模型　/ 81

3.5.3　模型應用　/ 83

3.6　遷移樣本篩選方案 / 88

3.6.1　背景介紹　/ 88

3.6.2　算法框架概覽　/ 88

3.6.3　搭建融合框架　/ 88

3.7　本章小結 / 93

第 4 章　倖存者偏差 / 94

4.1　倖存者偏差的含義 / 94

4.2　增量學習 / 95

4.3　生成對抗網絡 / 96

4.3.1 GAN模型介紹　/ 97

4.3.2 GAN與倖存者偏差　/ 98

4.4　高斯聚類模型 / 99

4.4.1 GMM算法原理　/ 99

4.4.2 GMM簡單應用　/ 102

4.4.3 GMM中的概率模型　/ 102

4.4.4 GMM樣本生成　/ 106

4.5　信息準則 / 108

4.5.1　赤池信息準則　/ 109

4.5.2　貝葉斯信息準則　/ 109

4.5.3 AIC與BIC比較　/ 110

4.6　本章小結 / 111

第 5 章　不均衡學習 / 112

5.1　樣本不均衡 / 112

5.2　代價敏感加權方案 / 113

5.3　插值過採樣方案 / 114

5.3.1 SMOTE算法　/ 114

5.3.2　過採樣算法實踐　/ 115

5.4　半監督學習方案 / 120

5.4.1　前提假設　/ 121

5.4.2 S3VM / 121

5.4.3 LP / 125

5.5　本章小結 / 129

第 6 章　異常檢測 / 130

6.1　離群點與欺詐檢測 / 130

6.2　z-score檢驗 / 131

6.3　LOF異常檢測法 / 132

6.3.1　原理與算法流程　/ 132

6.3.2 LOF樣本清洗方案　/ 134

6.4　IF異常檢測法 / 137

6.4.1　原理與算法流程　/ 137

6.4.2 PreA模型與冷啟動　/ 139

6.5　本章小結 / 141

第 7 章　模型優化 / 142

7.1　多損失函數分段預測 / 142

7.1.1 2種損失函數　/ 143

7.1.2　融合流程　/ 143

7.2　樹模型特徵衍生 / 145

7.2.1 GBDT離散化　/ 146

7.2.2　融合方案詳解　/ 146

7.2.3　特徵衍生細節　/ 147

7.2.4　案例　/ 148

7.3　時間序列建模 / 156

7.3.1 RNN / 157

7.3.2 LSTM / 160

7.3.3　門控結構　/ 161

7.3.4 LSTM行為評分卡案例　/ 163

7.4　高維稀疏數據建模 / 167

7.4.1　算法原理　/ 167

7.4.2　算法應用　/ 169

7.5　模型融合 / 171

7.5.1　模型融合基礎　/ 171

7.5.2　模型篩選　/ 172

7.6　本章小結 / 179

第 8 章　知識圖譜 / 180

8.1　複雜網絡基礎 / 180

8.2　中心度與相似性 / 183

8.3　節點分類 / 189

8.3.1　樸素節點分類　/ 189

8.3.2　鄰節點加權投票　/ 191

8.3.3　一致性標籤傳播　/ 193

8.4　社區發現算法 / 196

8.4.1　基礎概念　/ 196

8.4.2 Girvan-Newman算法　/ 197

8.4.3 Louvain算法　/ 199

8.4.4　社區評估　/ 200

8.5　網絡表示學習 / 202

8.5.1　矩陣分解　/ 203

8.5.2　節點嵌入　/ 207

8.6　圖卷積神經網絡 / 211

8.6.1　卷積神經網絡　/ 211

8.6.2　傅里葉變換　/ 213

8.6.3　拉普拉斯算子　/ 215

8.6.4 GCN中的圖卷積　/ 217

8.6　本章小結 / 221

參考文獻 / 222

分享到:

閱讀更多 薦書少年 的文章

關鍵字: 算法智能風控

薦書｜智能風控：原理、算法與工程實踐

圖書簡介

圖書目錄

相關文章:

薦書｜智能風控：原理、算法與工程實踐

圖書簡介

圖書目錄

相關文章:

萬物皆可“智能”標籤，但現AI並不“智能”，是否噱頭多過實際？

“智能”的電商WMS系統簡述

10.23 “智能”長三角離我們還遠嗎

“智能”主體的三大能力

“智能+”時代建築業迎來轉型升級新動能

“智能+”帶來新變革

“智能+” 製造業升級的源頭活水

智能+寧波經濟新引擎

“智能+”成為寧波產業發展新引擎

堃乾智能深耕『智能+』，全面迎接智能安防新挑戰

大城市無需定製，物聯網將會使小城市更加 “智能”

微軟的新專利想把織物變得更「智能」一點

如何讓人工智能更加“智能”？

to B必然，“智能”先行

空氣淨化+智能 是確有其用還是噱頭？

未來新零售：智能+實體零售！

阿里大調整，“智能”能否讓阿里雲起飛？

智能“性愛機器人”，你約嗎？

物聯網正加快擁抱「+智能」未來三年將是關鍵

城市中智能公交站牌的「智能」體現在哪裡？

智能，爲安全而來——夏珩解析小鵬汽車智能守護圈

+智能，見未來，淺談華爲未來的AI戰略布局

「智能+」變革消費，「+智能」重塑產業

普渡大學研究人員開發出列印「智能」物體的多功能3D印表機

機器人來了，在感知世界它很「智能」

華爲全聯接大會2018｜+智能，見未來

海信商用冷鏈“智能”突圍

“製造”的發展要優先於“智能”，而不是一味地強調“智能”

09.05 “製造”的發展要優先於“智能”，而不是一味地強調“智能”

機器人正經歷一個「智能+」的過程

微豹智能總經理硃紅旗：智能，是對生活舒適度的無休止探索

智能，讓生活更美好

「智能」鞋廠，12個人一天生產1500雙？

你所知道的人工智慧或許只是人工在強行「智能」！

華中製造業發力「智能+」——京東智能採購力推製造業多場景智能化

情景+智能，優衣庫新零售再領快時尚

TCL空調2019冷年新品來了，這次讓人記住的不只有「智能」

智能+短視頻，移動營銷進入下半場

抖音營銷峯會北京站 智能+短視頻重新定義移動營銷下半場

不是每款智能手錶 都真的夠“智能”！

“智能+”時代加速到來 多重風險仍需警惕

抖音年度營銷峯會廣州站 「智能+短視頻」 重新定義移動營銷

05.30 誰能扛起“智能”商務投影的大旗

05.28 悅讀｜人工智能時代，你更需要提高你的“智能”！

智能“手機帳”亮相新疆

「智能」一個嶄新的一個跨時代的關鍵詞，大家對未來都有什麼想法？

+智能：迎接未來世界的正確姿勢

微軟定義生產力引擎：移動、社交、自然UI、智能

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

空氣淨化+智能是確有其用還是噱頭？

抖音營銷峯會北京站智能+短視頻重新定義移動營銷下半場

不是每款智能手錶都真的夠“智能”！

“智能+”時代加速到來多重風險仍需警惕

抖音年度營銷峯會廣州站「智能+短視頻」重新定義移動營銷

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？