“掘金”金融AI落地,英特爾趟出一套通關攻略

有人說,金融業是最大的AI應用場景,但不管怎樣,不可否認的事實是金融業已經從數字化走向AI化。


某種程度上,AI與金融業有著天然的契合性:其一,金融業本身就是以數據為基本元素的行業,它為AI的模型訓練與預測推理提供了豐沃的數據土壤;其二,無論在效率和效益層面,AI能為金融企業業務的提升帶來巨大的革新,為行業發展創造更大空間。


以銀行為例,依託其龐大的業務數據,可以以智能的方式驅動數據分析與預測方法創新,進而獲得新洞察,擁抱更為靈敏、高效的商業模式,並規避諸如貸款逾期等挑戰,從而在未來競爭中搶得先機。


不過,大部分金融企業的傳統技術架構顯然無法匹配新潮的AI技術應用,同時目前市場上基於不同基礎設施的技術方案也給企業做選擇時帶來了不便。不過,需要指出的是,基於現有的英特爾CPU基礎設施的金融企業無需擔心,只要導入相應優化的AI框架和各種軟件工具,也可以無縫落地金融關鍵場景的AI應用。


迄今,英特爾已在助力金融行業AI落地的過程中,逐漸形成了一套完整的通關攻略。那麼,它在這條道路的具體應用案例是如何做的?效果如何?這就要從以下金融行業的四大關鍵應用說起。


四大關鍵應用案例 助力金融領域AI落地


金融反欺詐


伴隨金融業務的高速擴張,其風險指數也在不斷上升。尤其在銀行卡、信用卡等領域,欺詐損失率正隨著欺詐損失金額的增長而逐年上升。


傳統上,金融企業與機構往往採用基於規則的方式來構建其風控反欺詐模型,這種模型設計往往存在以下問題:

1

學習用戶行為的算法缺乏足夠的應用實踐;

2

傳統深度學習方法對數據量的要求大,但金融企業無法針對算法給出每個用戶行為模式的歷史交易數據;

3

數據非平衡性(Imbalance ratio)狀況嚴重,即絕大多數訓練數據都源自正常交易行為,正常 / 非正常數據比例大概是10萬~100萬: 1。


而隨著業務場景的增多,交易規則複雜度也不斷提升,這種設計使風控系統的資源消耗和監控時延持續增加。為此,金融機構開始嘗試利用AI能力建設依託於機器學習、深度學習等多種方法,構建更為高效的金融反欺詐模型。


以中國銀聯反欺詐案例為例,其基於GBDT—>GRU—>RF“三明治”結構的多層模型,以及基於英特爾®架構的多方位優化來構建欺詐偵測方案。


“掘金”金融AI落地,英特爾趟出一套通關攻略


首先,銀聯基於Analytics Zoo以及Spark* pipeline對數據進行流程化建模。而後,銀聯基於 “GBDT—>GRU—>RF” 三層架構模型,在上百個節點組成的訓練集群上開展其反欺詐偵測模型的構建,該方案已在偽卡/套現欺詐偵測等場景中進行了實測,全新的多層反欺詐模型無論是在召回率,還是在準確率方面都取得了良好效果。


信貸逾期風險


來自中國銀行保險監督管理委員會銀的數據顯示,截止2018年四季度末,中國商業銀行不良貸款餘額2.03萬億元人民幣,不良貸款率1.83% 。因此,對信貸業務實施高效的貸前貸後風險管控,就成為銀行構建風控系統的重要內容,而基於人工的風險預測方式顯然不能滿足這一需求。


這時就需要AI構建更有效的信貸逾期風險預測系統。而要構建完整的信貸逾期風險預測AI架構,實現高準確率、低延時以及可解釋的貸款逾期預測方案,就需要針對業務數據和環境數據進行分析和預測。


在英特爾與某大型商業銀行的合作探索中,雙方合作構建了基於LSTM和傳統機器學習的混合模型,來應對用戶在準確性和可解釋性兩方面的需求。同時,也針對環境數據的NLP模型的構建進行了探索。


“掘金”金融AI落地,英特爾趟出一套通關攻略


數據顯示,與人工預測方案相比,LSTM方法的準確性提升一倍,而混合模型方案的預測準確率能夠提升2倍以上,同時預測時延則縮短到了2天(預測效率提升10倍以上)。另外,在在線預測方案(可放貸風險預測)中,每筆預測時間均小於1秒,顯著提升了客戶滿意度。 最終的實際部署驗證表明,混合模型的方案可以有效提升預測的準確率,並大幅降低預測時延。


其中,英特爾不僅為這一新型的混合預測提供了高性能處理器產品,還提供了面向英特爾®架構優化的TensorFlow和英特爾®Python分發包等多樣化的軟件優化能力。


精準營銷策略


金融行業較高的信息化水平和數據優勢,推動業內企業加速進行各類推薦系統的構建,以 “千人千面”、“全用戶畫像”等方式,推動精準營銷和個性化營銷等重要應用的實施。利用海量結構化/非結構化數據,金融企業正構建一系列營銷決策模型,對終端用戶的行為喜好、使用體驗以及購買意圖等做出深入分析,進而推測市場前景,為相關金融產品或商業交易提供個性化建議,為金融企業營銷創新提供新鮮動力。


作為支付解決方案提供商,萬事達卡(MasterCard*)擁有26億張信用卡,年交易量達 560 億筆,並正通過將AI集成到其平臺來更好地為客戶服務,但在這一過程中也遇到了一些挑戰:

1

部署時間長,大量的深度學習模塊均需要在萬事達卡既有系統上重建;

2

與萬事達卡其他企業信息化模塊兼容性差,例如無法利用現有的ETL、數據倉庫和其他分析相關的數據技術與工具集;

3

數據需要在不同模塊之間頻繁複制,I/O性能成為瓶頸。


為應對這些挑戰,萬事達卡引入了英特爾Analytics Zoo “大數據分析+AI” 平臺,構建基於深度學習的推薦算法。基於最新的研究和行業實踐,方案選擇了神經協同過濾NCF和寬深WAD模型作為推薦的兩個候選模型,來自Analytics Zoo的Keras風格API也被用於基於Python和Scala構建深度學習模型。


在模型構建完成後,萬事達卡利用Analytic Zoo的服務API,已將深度學習和模型服務流程嵌入到基於Apache NiFi*構建的企業數據流水線中。


“掘金”金融AI落地,英特爾趟出一套通關攻略


從驗證結果來看,基於Analytics Zoo構建的深度學習模型比ALS模型(交替最小二乘法(Alternating Least Squares,ALS))有顯著的改進。


而在中國人壽上海數據中心實現壽險業務再發現的案例中,通過英特爾開源的 “大數據分析 +AI”平臺Analytics Zoo,利用神經協同過濾模型、寬深等深度學習模型,構建了高效的業務推薦系統。


影像分析


人臉檢測識別、圖像分割等一系列基於影像分析的AI應用正在保險行業中越來越廣泛。將AI影像分析應用嵌入到保險業務經營、風險管理、智能客服以及內部控制的全流程,能夠有效捕捉風險、優化業務流程,實現保險行業的AI賦能。


針對該領域的AI應用需求,英特爾在人臉檢測、比對、識別、活檢等各個模塊上提供了相應算法和模型,讓用戶無需從零開始,即可立即構建諸如人臉檢測識別等AI應用。


“掘金”金融AI落地,英特爾趟出一套通關攻略

基於智能應用實現的OCT病灶分割結果


在中國平安健康險評估的醫學影像應用案例中,英特爾利用2D圖像分類、檢測及定位上有著非常優異特性的ResNET和前沿的3D圖像分割模型V-Net分割網絡,以及面向英特爾®架構優化的Caffe等深度學習框架,對2D/3D 醫學影像進行AI推理。 通過實驗室以及臨床的反覆訓練和推理,平安智能醫學影像分析已在多個應用場景中獲得。


此外,英特爾®至強®可擴展處理器與針對英特爾®架構優化的深度學習框架也引入到這些應用中,這不僅能有效提升智能應用的推理效率,而且能夠以更高的性價比增強應用的落地能力和可部署性,加速AI在保險行業的應用。


番外篇:聯邦學習落地


如果說上述英特爾助力金融企業AI應用的四大應用場景更多側重於對不同模型的靈活兼容或對性能或效率的優化提升,那麼它與平安科技在聯邦學習上的協作,則更具開創意義。英特爾使得聯邦學習能夠在真正保障多源數據安全性的同時開展協同訓練。


“掘金”金融AI落地,英特爾趟出一套通關攻略


多源數據的交互、傳輸和聚合,也帶來了更為複雜的數據安全問題。通過硬件增強型安全技術的支持,在特定硬件中建立一個可信執行環境(Trusted ExecutionEnvironment,TEE),有效地防止外界觸達和攻擊敏感的數據和應用,是應對這一問題的更為可行的手段。


通過與英特爾開展深入技術合作,聯邦學習團隊成功地將 TEE 方案的重要支柱——英特爾®軟件防護擴展( Software Guard Extensions,簡稱 SGX)技術引入其聯邦學習方案,率先在多源數據協同實施 AI 訓練之路上開展了積極探索,並落地在保險、醫療、智能語音以及車聯網等多個領域。


賦能金融企業部署AI技術的底層支撐


AI技術落地離不開底層技術支持,在幫助金融企業進行AI落地時,英特爾以“全棧”AI能力進行賦能,以下介紹主要的硬件、軟件和框架。


硬件:

第二代英特爾®至強®可擴展處理器;英特爾®傲騰™數據中心級持久內存;英特爾®傲騰™固態盤


作為至強®平臺的創新之作,第二代英特爾®至強®可擴展處理器基於突破的設計,從平臺層面融合計算、內存、存儲、網絡等功能。 具體來說,它具有更高的每核性能,基於VNNI的英特爾®深度學習加速(英特爾®DL Boost)技術,更大的內存帶寬/容量,英特爾®Infrastructure Management技術以及面向數據中心的英特爾®Security Libraries (英特爾®SecL-DC)等功能特性。


“掘金”金融AI落地,英特爾趟出一套通關攻略


英特爾®傲騰™數據中心級持久內存隨其他英特爾®至強®可擴展處理器平臺產品一併面市,並針對第二代英特爾®至強®可擴展處理器做了優化,它在英特爾內部看做是一款“革命性”產品。


“掘金”金融AI落地,英特爾趟出一套通關攻略


英特爾® 傲騰™固態盤則重點採用3D XPoint TM存儲介質,並結合了一系列的內存控制器、接口硬件和軟件技術,可幫助消除數據中心存儲瓶頸,並允許使用更大型、更經濟實惠的數據集,進而加快應用程序速度、降低延遲敏感型工作負載的事務處理成本,並改善數據中心的 TCO。英特爾®傲騰™固態盤無疑能夠為數據密集型的 AI 模型訓練和推理帶來更高的效率。、


軟件和框架:

分析與AI平臺Analytics Zoo+面向英特爾®架構優化的Caffe、TensorFlow、Python + OpenVINO™工具套件


面向深度神經網絡的英特爾®數學核心函數庫(Intel®Math Kernel Library, 英特爾 ® MKL-DNN),是一款面向深度學習應用的開源性能增強庫(源代碼地址: https://github.com/intel/mkl-dnn ),也是英特爾為了幫助開發人員充分利用英特爾®架構,推進深度學習的研究和應用而創建的基礎庫。


該函數庫目前已成為眾多深度學習框架在CPU上運行時的基本配置。開發者可在深度學習框架的安裝和應用中,直接獲得英特爾®MKL-DNN 帶來的性能提升。


“掘金”金融AI落地,英特爾趟出一套通關攻略


Analytics Zoo是一個統一的大數據分析與人工智能開源平臺,是為方便用戶開發基於大數據、端到端的深度學習應用而推出。 它可幫助用戶將Spark、TensorFlow、Pytorch、Keras和BigDL程序,以及日後可能需要支持的其它框架等,無縫集成到一個管道之中 ; 將這些模型透明地擴展到成百上千節點規模的大數據集群,進行分佈式訓練或推理,從而進一步簡化了人工智能解決方案開發,且無需額外的專用基礎設施。


“掘金”金融AI落地,英特爾趟出一套通關攻略


面向英特爾®架構優化的Caffe則集成了最新版的英特爾®MKL,專門面向當時至強 ® 處理器產品已經集成的英特爾® AVX 2和英特爾®AVX-512 做了優化。此外,它還支持完備的Post-training量化方案,並在大量CNN模型中得到實踐。面向英特爾®架構優化的TensorFlow,能夠確保深度學習類工作負載在各種情況下都可利用英特爾 ® MKL-DNN 基本運算單元高效運行。 面向英特爾®架構優化的Python分發包,提供了編寫Python 原生擴展所需的一切 , 包括 C 和 Fortran編譯器、數學庫和分析器,並且集成了多個高性能數據分析和數學庫。經過基準測試,對比英特爾®Python 分發包與其它開放源碼Python中Scikit-learn工具包的效率,前者的指標有顯著提升。


“掘金”金融AI落地,英特爾趟出一套通關攻略


OpenVINO™工具套件則是英特爾推出的一款加速深度學習推理及部署的軟件工具套件,用以加快到智能交通、智能醫療等領域的高性能計算機視覺處理和應用。該工具套件目前提供預先轉換的Caffe、TensorFlow、 Mxnet模型的MO文件,還具備超過20個預先訓練的模型。軟件開發人員和數據科學家等可以利用這些工具,快速實現個性化的深度學習應用,且可以使用OpenCV、 OpenVX的基礎庫,去創建特定的算法,進行定製化和創新型應用的開發。


結語


可以看到,英特爾利用自身軟硬件產品的優勢深入金融行業從反欺詐、信貸風險到精準營銷等各場景應用,結合其實踐經驗,已經能給客戶提供一套完善的AI+金融技術解決方案。


隨著金融行業不斷利用AI技術來驅動業務的轉型升級,加快智能化升級進程,像英特爾這樣的企業將加速行業AI技術落地,升級IT基礎設施,助力企業從大量數據中的洞察能力,最終成為金融行業的堅實後盾。


進入 [ 英特爾商用頻道 ] 微信公眾號聊天界面,私信“金融行業AI實戰手冊”,即刻領取《英特爾中國金融行業 AI 實戰手冊》,不容錯過!



本文僅代表媒體觀點


分享到:


相關文章: