高效骨幹搜索;學習擴充;最小人臉檢測器;​DEPARA等

今日 Paper | 高效骨幹搜索;學習擴充;最小人臉檢測器;​DEPARA等

目錄

用於場景文本識別的高效骨幹搜索

學習擴充:用於文本識別的聯合數據增強和網絡優化

KPNet:最小人臉檢測器

DEPARA:深度知識可遷移性的深度屬性圖

用於任意形狀文本檢測的深度關係推理圖網絡

用於場景文本識別的高效骨幹搜索

論文名稱:Efficient Backbone Search for Scene Text Recognition

作者:Zhang Hui /Yao Quanming /Yang Mingkun /Xu Yongchao /Bai Xiang

發表時間:2020/3/14

論文鏈接:https://paper.yanxishe.com/review/14658?from=leiphonecolumn_paperreview0401

推薦原因

這篇論文要解決的是場景文本識別(Scene Text Recognition, STR)的問題。過去的研究更加重視通過改進預處理圖像模塊來提高性能,比如校正和去模糊,或者序列轉換器。然而,另一個關鍵模塊,即特徵序列提取器,還沒有得到廣泛的研究。這篇論文提出了一個自動化場景文本識別(AutoSTR)方法來搜索依賴於數據的主幹模型,以提高文本識別性能。首先,新方法為STR設計了一個特定於域的搜索空間,其中包含了各種運算的選擇和下采樣路徑的約束。然後,新方法使用了一個兩步搜索算法,它解耦了操作和下采樣路徑,可以在給定的空間中進行有效的搜索。實驗表明,通過搜索依賴於數據的主幹,AutoSTR可以在更少錯誤和模型參數的情況下,在標準基準數據集上超越最先進的方法。

今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等
今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等

學習擴充:用於文本識別的聯合數據增強和網絡優化

論文名稱:Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition

作者:Luo Canjie /Zhu Yuanzhi /Jin Lianwen /Wang Yongpan

發表時間:2020/3/14

論文鏈接:https://paper.yanxishe.com/review/14657?from=leiphonecolumn_paperreview0401

推薦原因

這篇論文被CVPR 2020接收,要解決的是文本識別問題。

這篇論文提出了一種新的文本圖像數據增強方法。與傳統增強方法(例如旋轉、縮放和透視變換)不同,新方法旨在掌握適當而高效的數據增強方法,對於訓練健壯的識別器更有效而具體。新方法通過使用一組自定義基準點變得靈活而可控,並通過聯合學習彌合了孤立數據增強過程與網絡優化之間的鴻溝。代理網絡從識別網絡的輸出中學習並控制基準點,從而為識別網絡生成更合適的訓練樣本。在包括常規場景文本、不規則場景文本、手寫文本在內的各種基準上進行的大量實驗表明,這篇論文提出的增強方法和聯合學習策略顯著提高了識別網絡的性能。

今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等

KPNet:最小人臉檢測器

論文名稱:KPNet: Towards Minimal Face Detector

作者:Song Guanglu /Liu Yu /Zang Yuhang /Wang Xiaogang /Leng Biao /Yuan Qingsheng

發表時間:2020/3/17

論文鏈接:https://paper.yanxishe.com/review/14656?from=leiphonecolumn_paperreview0401

推薦原因

這篇論文發表於AAAI 2020,考慮的是人臉檢測的問題。

這篇論文發現臉部外觀特徵具有足夠的判別力,用微型淺層神經網絡也可以從背景中進行檢測。與大多數自上而下聯合面部檢測和對齊方法不同,所提KPNet以自下而上的方式檢測較小的面部關鍵點,而非整個面部。KPNet首先通過精心設計的細粒度比例逼近和比例自適應Soft-argmax運算符從低分辨率圖像預測面部界標。無需任何複雜的頭部架構或精心的網絡設計,KPNet只需約1M參數即可實現通用人臉檢測和對齊基準的當前最佳準確率,在GPU上的運行速度為1000fps,且易於在大多數前端芯片上實時執行。

今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等

DEPARA:深度知識可遷移性的深度屬性圖

論文名稱:DEPARA: Deep Attribution Graph for Deep Knowledge Transferability

作者:Song Jie /Chen Yixin /Ye Jingwen /Wang Xinchao /Shen Chengchao /Mao Feng /Song Mingli

發表時間:2020/3/17

論文鏈接:https://paper.yanxishe.com/review/14655?from=leiphonecolumn_paperreview0401

推薦原因

這篇論文被CVPR 2020接收,提出了名為DEPARA的深度屬性圖模型,以研究從預訓練的深度神經網絡(PRe-trained Deep Neural Networks,PR-DNN)中獲得的知識的可遷移性。在DEPARA中,節點對應於輸入,並由它們在PR-DNN的輸出的向量化屬性圖表示。邊表示輸入之間的相關性,並通過從PR-DNN中提取的特徵相似度來衡量。兩個PR-DNN的知識可遷移性是通過它們對應的DEPARA的相似性來衡量的。這篇論文將DEPARA應用於遷移學習中的預訓練模型選擇和層選擇問題,並通過大量實驗證明所提方法在解決這兩個問題上的有效性和優越性。

今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等
今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等

用於任意形狀文本檢測的深度關係推理圖網絡

論文名稱:Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection

作者:Zhang Shi-Xue /Zhu Xiaobin /Hou Jie-Bo /Liu Chang /Yang Chun /Wang Hongfa /Yin Xu-Cheng

發表時間:2020/3/17

論文鏈接:https://paper.yanxishe.com/review/14654?from=leiphonecolumn_paperreview0401

推薦原因

這篇論文已經被CVPR 2020接收,要解決的是任意形狀的文本檢測。

這篇論文提出了一種用於任意形狀文本檢測的新統一關係推理圖網絡。在該方法中,局部圖通過卷積神經網絡橋接了文本提議模型,並通過圖卷積網絡跨越深度關係推理網絡,從而使所提網絡端到端可訓練。具體而言,每個文本實例將被分成一系列小的矩形組件,並且這些小組件的幾何屬性(如高度、寬度和方向)將由文本提案模型估算。給定幾何屬性,本地圖構造模型可以大致建立不同文本組件之間的鏈接。為進一步推理並推論組件與其鄰居之間鏈接的可能性,這篇論文采用基於圖的網絡對局部圖執行深度關係推理。公開數據集上的實驗證明了所提方法具有當前最佳性能。

今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等
今日 Paper | 高效骨干搜索;学习扩充;最小人脸检测器;​DEPARA等

雷鋒網雷鋒網雷鋒網


分享到:


相關文章: