06.04 機器學習在信息安全領域的五大典型應用

“知物由學”是網易雲易盾打造的一個品牌欄目,詞語出自漢·王充《論衡·實知》。人,能力有高下之分,學習才知道事物的道理,而後才有智慧,不去求問就不會知道。“知物由學”希望通過一篇篇技術乾貨、趨勢解讀、人物思考和沉澱給你帶來收穫的同時,也希望打開你的眼界,成就不一樣的你。當然,如果你有不錯的認知或分享,也歡迎通過郵件([email protected])投稿。

作者介紹:Doug Drinkwater是IDG集團的EMEA內容總監。

知物由學 | 機器學習在信息安全領域的五大典型應用

機器學習(Mashine Learning)顧名思義就是“讓計算機具備自主學習的能力”。機器學習的過程:首先需要在大規模數據集上使用數學方法進行模型訓練,然後利用獲得的模型進行預測分類工作。例如Netflix可以根據觀看歷史,投其所好的給用戶推送新劇集;無人駕駛汽車會自己學習如何根據道路情況規避行人。

機器學習在信息安全領域的應用發展迅速。據ABI研究院統計,到2021年,機器學習在網絡安全中的應用能夠給大數據和人工智能(AI)等相關行業帶來960億美元的市場規模。世界上嗅覺靈敏的科技巨人已經在該趨勢中佔得了一席先機。谷歌採用機器學習技術,分析基於Android系統移動終端面臨的威脅、識別並清除手機中的惡意軟件;雲計算巨人Amazon併購了創業公司harvest.AI,同時推出了Macie服務,該服務使用機器學習技術對S3存儲雲中的數據進行排序和分類。

與此同時,企業級的安全廠商也將機器學習技術融入到產品中,以提高惡意軟件的檢測能力。大部分安全公司也改變了以往單純“基於簽名”的檢測方法,轉而使用機器學習技術來識別惡意軟件。雖然還只停留在起步階段,但這明顯是未來的發展方向。人工智能和機器學習將來會顯著改變安全領域的格局。

下面就梳理一下,機器學習在信息安全防護方面有哪些典型的應用。

1.利用機器學習檢測惡意行為並阻斷攻擊

機器學習算法能夠快速檢測識別出惡意行為,並且對攻擊行為進行及時阻斷,從而將威脅消滅在萌芽狀態。Darktrace是一家成立於2013年的英國初創公司,該公司的機器學習技術幫助北美一家賭場成功阻止了一起數據洩漏攻擊事件,該公司還在去年夏天Wannacry勒索軟件危機中大顯身手,這種勒索軟件感染了150多個國家的20萬用戶,公司的機器學習算法快速定位捕捉到攻擊,並採取措施消除了威脅,由於發現阻斷及時,該公司的用戶甚至包括那些沒打補丁的用戶都未遭受任何損失。

2.使用機器學習分析移動終端安全狀況

機器學習技術雖然已經在移動設備上得到應用,但到目前為止,主要還集中在谷歌 Now, 蘋果Siri和亞馬遜Alexa等語音應用中。不過,谷歌正在使用機器學習來分析移動終端面臨的威脅,以處理在工作中使用個人手機而帶來的安全隱患。

此外,還有多家公司也推出各自的解決方案。MobileIron和Zimperium兩家公司宣佈了一項合作計劃,共同為移動設備提供基於機器學習的反惡意軟件工具。該工具將MobileIron的安全合規性引擎與Zimperium的機器學習檢測方法合二為一,能夠檢測設備、網絡和應用面臨的多種威脅,並會根據安全狀況自動採取應對措施來保護數據安全。Wandera公司近期也發佈攻擊檢測引擎MI:RIAM,據報道稱該引擎可以發現超過400個勒索軟件及其變種。

3.藉助機器學習提高信息安全分析水平

藉助機器學習,可以顯著提高信息安全各方面的技術水平,包括惡意攻擊檢測、網絡分析、終端保護和脆弱性評估等。2016年MIT的計算機科學與人工智能實驗室(CSAL)開發了一套AI2系統,這一個自適應機器學習平臺,能夠幫助安全技術人員進行“大海撈針”式的數據過濾,識別出真正的安全威脅。CSAL和PatternEx的聯合實驗顯示該系統的威脅檢測率達到了85%,同時誤報率減少了5倍。

4.依靠機器學習自動完成重複的安全任務

機器學習的真正好處在於可以自動完成重複任務,讓安全人員可以將精力集中在更重要的工作上。機器學習最終將會把安全人員從“重複的、低價值”的活動中解放出來,從而有更多的時間來完成更有意義的工作。

5.通過機器學習來消除0-day漏洞

研究人員希望通過機器學習技術來消除系統漏洞,特別是0-day以及威脅物聯網設備安全的漏洞。亞利桑那州立大學的研究團隊嘗試採用機器學習監視暗網的流量,希望能夠發現利用0-day漏洞進行攻擊的相關數據。通過這種方法,可以及時消除0-day漏洞帶來的威脅,防止關鍵數據洩漏。

結束語

機器學習並不是解決任何問題的靈丹妙藥,很多技術還處於概念驗證階段,陷阱也無處不在。現在的機器學習系統(特別是無監督學習方法)還是會產生大量的誤報。機器學習工具對一些安全人員來說完全就是個黑盒,對其內在機理和檢測能力不甚了了,只能將安全責任盲目交給安全廠商。

  • 此外,大部分的機器學習算法都不是在用戶實際環境中開發出來的,機器學習模型都是在廠商的數據環境中訓練出來的,部署到用戶環境中,具體效果如何還需要實際的檢驗。而且,機器學習算法設計是否科學、訓練模型的數據是否準確,都決定了機器學習技術能否發揮真正的效能。


分享到:


相關文章: