機器學習不斷接近人腦水平 AI圖像識別未來發展如何?

過去十幾年,人類可以說是在機器智能面前節節退敗,屢敗屢戰,而多任務處理(multi-tasking)幾乎是為數不多可以讓人類驕傲的事情了。人們可以同時打開8個網站、數份文檔和一個交友軟件,即使正在專心處理其中一件事,只要突然收到一條回覆或更新提醒,也能夠快速安排。對機器而言,要在同一時間完成這樣的任務顯然有點困難,因此,多任務處理一直被視為人類獨有的技能點。

然而,這個優勢也將失去了。

近幾年,Alphago、視頻識別、指紋解鎖、圖片識別、語音轉文字、機器人看病等一系列事件,使我們深刻的感受到人工智能在改變我們的工作方式和認知。國內人工智能產業中,就算集視覺與圖像領域公司的數量已達數百家,僅次於自然語言處理類公司,位居第二。其中該領域最為出名的創業公司包括曠世科技Face++、商湯科技、極鏈科技Video++等。

一百多年前,電改變了生產、交通和農業等產業,而今天,人工智能也像電一樣將改變傳統產業。人臉識別和圖片識別是人工智能視覺與圖像領域中的兩大熱門應用。但將人工智能技術單純用於圖片識別分析的應用企業數量並不如預想的多,可能有以下幾個方面的原因:目前視頻監控方面的盈利空間大,眾多企業的注意力都放在了視頻監控領域,人臉識別屬於圖片識別的一個應用場景,做人臉識別的大多數企業同時也在提供圖片識別服務,但是銷售效果不佳,主要贏利點還在於人臉識別等。

機器學習不斷接近人腦水平 AI圖像識別未來發展如何?

識別物體是圖片分類的另一個比較常見的應用,例如一個簡單的手機識別模型,我們首先要給計算機定義模型,然後準備大量手機的照片去訓練這個模型,讓計算機能識別出來,輸一張圖片的時候能識別出圖片是不是手機。正常情況下計算機模型能識別得比較準確,但是當我們輸入了一些有遮擋、形態多變或者角度多變、光照不易的圖片時,之前我們建立的模型就識別不出來了。這就是計算機視覺在應用中尋在的難點問題。機器學習的本質其實就是為了找到一個函數,讓這個函數在不同領域發揮不同的作用,像語音識別領域,這個函數會把一段語音識別成一段文字。圖像識別的領域,這個函數會把一個圖像映射到一個分類。

進入21世紀,計算機視覺與計算機圖形學的相互影響日益加深,基於圖像的繪製成為研究熱點,高效求解複雜全局優化問題的算法得到發展。到現在,通過技術迭代更新和機器學習,物體的識別率也已經達到了相當高的水平。像是極鏈科技Video++自主開發的文娛人工智能系統「VideoAI」已實現場景、物體、人臉、品牌、表情、動作、地標、視覺特徵檢索8大維度的數據結構化,同步生成軌跡流數據,通過複合推薦算法將元素信息升級為情景信息,直接賦能各種商業化場景。

機器學習不斷接近人腦水平 AI圖像識別未來發展如何?

通過SAS針對企業人工智能的調研報告可以看出,大部分企業認為人工智能還處於初期階段,但我們也可以發現,正在部署的大量應用場景都包含AI板塊。顯而易見我們必須學習新的技能來配合AI的發展,未來也是屬於意識到這一點並立即發展的企業。機器的每一點進步都依賴於不斷模擬和接近人腦的水平,提升AI在場景應用上的工程能力,會為生活帶來更多的便利。


分享到:


相關文章: