06.15 盤點在現實中運用領域最多的9項機器學習應用!

1. 目的

隨著世界邁向數字時代,我們能看到的現代創新之一就是機器學習。這種令人難以置信的人工智能形式已經在各行各業中得到應用。例如,圖像和語音識別、醫學診斷、預測、分類、學習關聯、統計套利、提取、迴歸。今天,我們來看看當今現代世界中所有的這些機器學習應用程序。

如果你不熟悉機器學習,那麼你可以閱讀之前關於機器學習簡介的博客。(http://data-flair.training/blogs/machine-learning-tutorial/)

盤點在現實中運用領域最多的9項機器學習應用!

2. 機器學習應用程序

讓我們逐一討論所有現實世界的機器學習應用。

2.1 圖像識別

機器學習最常見的用途之一就是圖像識別。在很多情況下,你可以把對象歸類為數字圖像。對於數字圖像,測量描述了圖像中每個像素的輸出。

在黑白圖像的情況下,每個像素的強度用作一次測量。因此,如果黑白圖像具有N×N個像素,則像素總數和測量結果為N2。

在彩色圖像中,每個像素被認為提供了3個主要顏色分量(即RGB)的強度測量。所以N×N色圖像有3個N2測量值。

· 用於人臉檢測——可能是人臉,也可能不是人臉。在每個人的數據庫中,每個人可能都有一個單獨的類別。

· 對於字符識別 - 我們可以將一段文字分割成較小的圖像,每個圖像包含一個字符。這些類別可能包含26個英文字母,10個數字和一些特殊字符。

2.2 語音識別

語音識別(SR)是將口頭文字翻譯成文本的過程。它也被稱為"自動語音識別"(ASR)、"計算機語音識別"或"文本語音"(STT)。

在語音識別中,軟件應用程序可以識別口語詞彙。這個應用中的測量可能是一組表示語音信號的數字。我們可以把信號分割成包含不同單詞或音素的部分。在每個段中,我們可以用不同時頻段的強度或能量表示語音信號。

雖然信號表示的細節超出了程序的範圍,但我們可以用一組實際值來表示信號。

語音識別應用包括語音用戶界面。語音用戶界面如語音撥號、呼叫路由、域名設備控制等。它也可以用作簡單的數據輸入、準備結構化文件、文本語音的處理。

盤點在現實中運用領域最多的9項機器學習應用!

2.3 醫療診斷

ML提供了方法、技術和工具,可以幫助解決各種醫療領域的診斷和預後問題。它被用於分析臨床參數及其組合對預後的重要性。例如,預測疾病進展、提取對結果研究的醫學知、對治療的計劃和支持以及全面的患者管理。ML也被用於數據分析,例如通過適當處理不完善的數據、對重症監護室使用的連續數據的解釋以及智能報警,從而進行有效和高效的監測來檢測數據的規律性。

有人認為,ML方法的成功實施可以幫助將基於計算機的系統整合到醫療保健環境中,為促進和加強醫學專家的工作提供機會,並最終提高醫療保健的效率和質量。

在醫學診斷中,主要運用在確定一種疾病的存在,對其進行準確的識別上。正在發生的每種疾病都有一個單獨的類別,而沒有出現的疾病有另一個類別。在這裡,機器學習通過分析患者的數據來提高醫學診斷的準確性。

本應用中的測量結果通常是某些醫學測試(例如血壓、溫度和各種血液測試)或醫學診斷(例如醫學圖像)的結果,各種症狀的存在/不存在/強度以及關於患者的基本身體信息(年齡、性別、體重等)。根據這些測量結果,醫生縮小了患者的可能所患疾病的範圍。

盤點在現實中運用領域最多的9項機器學習應用!

2.4 統計套利

在金融領域,統計套利指的是短期內通常涉及大量證券的自動交易策略。在這樣的策略中,用戶嘗試基於諸如歷史相關性和一般經濟變量之類的量來實施一組證券的交易算法。這些測量結果可以作為分類或估算問題進行轉換。基本假設是價格將向歷史平均水平移動。

我們採用機器學習方法來獲得指數套利策略。特別是,我們將線性迴歸和支持向量迴歸(SVR)應用到了交易所交易基金和股票流的價格上。通過使用主成分分析(PCA)來減少特徵空間的維數,我們觀察了SVR在應用中的優點並注意到了存在的問題。為了生成交易信號,我們將先前回歸的殘差構建模型,查看平均回覆過程。

在分類的情況下,可能會存在被出售、購買等任何情況。作者估計一個人可能會先試圖預測未來時間範圍內每個證券的預期收益。在這種情況下,通常需要使用預期收益的估計來作出交易決策(買入、賣出等)。

2.5 學習關聯

學習關聯是對產品之間各種關聯進行深入研究的過程。一個很好的例子是,在分析與顧客行為有關時,看似不相關的產品可能會揭示出彼此之間的關聯。

機器學習的一個應用——通常研究人們購買的產品之間的關聯,也被稱為購物籃分析。如果買家購買'X',他或她是否會因為它們之間的關係而購買'Y'?當新產品在市場上推出時,瞭解了這些關係,就會發展出新的關係。瞭解這些關係可能有助於向客戶推薦相關產品。客戶購買它的可能性更高,它也可以幫助捆綁產品獲得更好的銷售。

通過機器學習產品之間的關聯就是學習關聯。一旦我們通過檢查大量銷售數據找到了一個關聯,大數據分析師可以在學習條件概率的過程中推導出一個概率檢驗的測試。

2.6 分類

分類是把每個人從被研究的人群中分成許多類的過程。這是自變量。

分類有助於分析人員使用對象的度量來識別該對象所屬的類別。為了建立一個有效的規則,分析師使用數據,而數據又是由許多具有正確分類的對象組成。

例如,在銀行決定發放貸款之前,它會評估客戶償還貸款的能力。通過考慮客戶的收入、年齡、儲蓄和財務歷史等因素,我們可以做到這一點。這些信息來自過去的貸款數據。因此,Seeker用於創建客戶屬性和相關風險之間的關係。

2.7 預測

以銀行為例,計算出任何貸款申請人違約償還貸款時出錯的概率。為了計算出錯的概率,系統首先需要對某些組中的可用數據進行分類。它是由分析師人員定的一套規則來描述。

一旦我們完成分類,根據需要我們可以計算出概率。這些概率計算可以在所有扇區上針對各種目的進行計算。

當前預測是最熱門的機器學習算法之一。讓我們舉一個零售的例子,之前我們可以獲得諸如上個月/年/ 5年/聖誕節的銷售報告。這些類型的報告被稱為歷史報告。但是目前企業更感興趣的是找出下個月/年/排燈節等的銷售情況。

因此,企業可以及時作出必要的決策(與採購、庫存等有關)。

2.8 提取

信息抽取(IE)是機器學習的另一個應用。它是從非結構化數據中提取結構化信息的過程。例如網頁、文章、博客、商業報告、電子郵件和關係數據庫維護信息提取產生的輸出。

提取過程將輸入作為一組文檔並生成結構化數據。這個輸出是關係數據庫中的彙總表格,例如excel表格和表格。

現在,提取已經成為大數據行業的關鍵。

正如我們所知道的那樣,大量的數據正在生成,大部分數據都是非結構化的。第一個關鍵挑戰是處理非結構化數據。現在,將非結構化數據轉換為基於某種模式的結構化數據,以便可以將相同的數據存儲在RDBMS中。

除此之外,當前的數據收集機制也在發生變化。早些時候,我們以批次方式收集數據,例如"一天結束"(EOD),但現在企業需要在數據生成後立即收集數據,即實時收集數據。

2.9 迴歸

我們也可以將機器學習應用於迴歸中。

假設x = x1,x2,x3,... xn為輸入變量,y為輸出變量。在這種情況下,我們可以使用機器學習技術根據輸入變量(x)生成輸出(y)。你可以使用模型來表示各種參數之間的關係,如下所示:

Y = g(x)其中g是取決於模型特定特徵的函數。

在迴歸中,我們可以利用機器學習的原理來優化參數,為了減少近似誤差並計算出儘可能接近的結果。

我們也可以使用機器學習來優化功能,選擇改變輸入以獲得更好的模型。這為我們提供了一個新的、改進的模型。這就是所謂的響應面設計。

3. 結論

總之,機器學習在人工智能領域是一個令人難以置信的突破。這些對機器學習的應用是我們生活日新月異的主要"推手"。


分享到:


相關文章: