飛馬網於11月8日晚邀請到清華大學深圳研究生院在站博士後曲曉峰老師為大家分享機器視覺中的深度學習相關知識。
以下是本次線上直播分享的實錄:
今天分享的主題是揭秘機器視覺中的深度學習。
一、機器視覺簡介
機器視覺簡單說就是基於圖像的工業自動化檢測。
機器視覺的硬件組成主要包括五部分:
1、光源:簡單理解就是燈,常見的是LED,機器中常見的也有日光燈等高亮的燈,色溫等都有很大的影響。
2、鏡頭:比較具有代表性。常見就是普通的鏡頭組,代表呈現的光學系統。
3、相機:傳感器。
4、採集卡:針對傳統相機,現在很多存在返卡。
5、運算平臺:通常來說,機器視覺的運算平臺就是一個PC,只不過用的是工業控制機。工控機是一個很結實、扛燥的PC。除此之外,也有一些是小型的嵌入式設備;或運算平臺和相機結合在一起,也就是智能相機。
常見的應用例子:
計數、包裝印刷、紡織品、電子產品等的表面檢測、運動定位、尺寸測量、OCR
機器視覺行業近幾年的發展
在2000年以後才興起的;
在2008年,金融危機波折,使得整個行業受很大影響;
近年人工智能復興,又進入了上升期。
項目開發流程:
需求、系統、算法、軟件、投產生產
與計算機視覺、圖像處理的區別:
機器視覺的理解很多,這裡從狹義的基於圖像的工業自動化檢測。光機電系統化、項目定製化。光機電系統化、項目定製化
計算機視覺更為廣義,對場景的理解。
圖像處理:底層技術,不管是計算機視覺還是機器視覺都用到很多圖像處理的技巧。
二、深度學習在機器視覺行業的應用
深度學習
一般是指多層的卷積神經網絡(圖像)或者循環神經網絡(語言或語音)在我的這次分享中,機器視覺專指深度的卷積神經網絡或者是以這個為基礎的其他一些算法。
模式:卷積層+基礎層,或者重複很多次,形成全連接,然後輸出
核心:多層次的卷積和非線性的激活
主要優化方法:梯度負反饋
有效性的反饋:基於目標數據的優化和充足的計算能力
涉及難點:根據需求定義一個合適的損失函數
機器視覺行業
從產品上劃分(如圖)
機器視覺行業企業
從歷史沿革上劃分
傳統機器視覺公司:大恆、凌雲、微視(之前的很多從業走出繁衍)
大型製造集團北京的機器視覺子公司:海康、大華
人工智能浪潮下的創業企業
國際上:美國、加拿大、日本、德國
機器視覺軟件生態(如圖)
ViDi
隨著深度學習的興起而誕生
主要分三個組件
綠色:針對分類問題
藍色:針對定位問題和識別問題,檢測或計數的目標在哪等
紅色:缺陷檢測
具體實現;
綠色模塊(如圖)
藍色模塊(如圖)
紅色模塊(如圖)
例子:TensorFlow的Faster R-CNN(如圖)
作用:無代碼或者少代碼的實現物體檢測,可以迅速上手,且潛力巨大;在與訓練模型上做不需要幾周幾個月,一天即得;簡單切換訓練數據,迅速驗證概念可行性
三、展望
深度學習的發展趨勢與侷限:
1、深度學習在圖像處理方面是一種特徵提取方法,是一種優化方法
2、在算法開發的各個流程,都還可以顯著提升效果
3、受運算性能侷限,網絡不能無限加深,近期學術上研究的熱點是提高效率,縮小體積同時還能保證一定的性能。現在幾乎各大廠商都在推出帶有AI引擎的芯片來終端市場,就是想把深度學習賦能到生活中去
4、深度學習的應用領域還在不斷拓展
5、非監督,少樣本甚至單樣本效果還不理想
6、深度學習雖然很強大,但也只是算法,物理上拿不到的信息,深度學習也變不出魔法
機器視覺行業發展
1、以深度學習為基礎,一些應用上會出現規模化市場
2、對運算能力的需求還會繼續增加
3、新一代的智能相機必備AI引擎
4、中高端定製化市場暫時還難以被深度學習攻破,但會受益於深度學習帶來的提高
以上就是本次線上直播的主要內容,相信你對該領域的知識已經有了一定的認識。想了解更多更詳細內容的小夥伴們,可以關注服務號:FMI飛馬網,點擊菜單欄飛馬直播,即可進行學習。
閱讀更多 飛馬網FMI 的文章