使用這3個谷歌大腦的數據增強最佳策略訓練你的網絡

作者:Less Wright
編譯:ronghuaiyang

導讀

對於物體檢測來說圖像增強最有效的三種方法。

谷歌Brain剛剛發佈了一篇新論文,回答了許多深度學習實踐者關於“什麼對訓練物體檢測模型最有效”的問題。

使用這3個谷歌大腦的數據增強最佳策略訓練你的網絡

摘錄自谷歌的論文,顯示了從他們的增強策略對性能的持續改善

雖然通常的做法是簡單地使用與圖像分類(翻轉等)類似的增強技術,但他們發現,作為用於物體檢測的“學習”增強策略的一部分,專門的增強效果更好。在他們全新的增強策略中高度使用了這些“前3”檢測特定數據增強技術,他們在COCO數據集上實現了最先進的RetinaNet的精度,並進一步表明它在許多其他架構和數據集上工作得很好。換句話說,如果你想優化物體檢測模型,你需要確保了使用這些數據增強,並且儘可能使用它們的完整增強策略!

此外,最新的和持續的,最大的研究主題“數據增強,而不是顯式的正則化”(請參閱我的前一篇文章:https://medium.com/swlh/optimal-cnn-development-use-data-augmentation-not-explicit-regularization-dropout-weight-decay-c46fb6b41c02),他們還表明,數據增加這三種類型本質上提高L2範數的權重,沒有明確的正規化。

“增強策略優於用於物體檢測的最先進的體系結構正則化方法,即使在考慮強基線時也是如此。”

上面的引用來自他們的論文,這篇論文在這裡:https://arxiv.org/abs/1906.11172v1,但是讓我們深入瞭解一些用於訓練最先進的物體檢測模型的新最佳實踐的快速概述和總結!

他們的研究結果包括:

  1. 使用圖像分類技術有助於目標檢測模型,但淨收益有限。
  2. 通過建立一個強化學習平臺,測試各種數據增強,他們找到了一個“最優”的增強策略,使用一系列成對的增強。在他們的策略中使用的前3個增加是:
  3. A. rotate — 雖然旋轉也意味著邊界框相對於物體變得更大,但旋轉似乎是最好的增強。


使用這3個谷歌大腦的數據增強最佳策略訓練你的網絡

物體旋轉增強,注意,邊界框需要變大

B. 均衡化 — 這個操作簡單的對圖像直方圖進行了拉平操作

C. 邊界框沿著Y軸運動 — 這將使包圍框中的物體沿Y軸上下移動(向上或向下的幾率為50%)。

通過測試各種ResNet體系結構,可以看到使用跨主幹網絡的學習到的增強變換策略的改進。此外,他們還將其與DropBlock增強進行比較,並測試了增強的類別(顏色、幾何和邊框),以顯示增強的可加性:

使用這3個谷歌大腦的數據增強最佳策略訓練你的網絡

使用各種ResNet架構和DropBlock比較的結果

谷歌Brain已經發布了他們最優策略的訓練代碼,但它只在TensorFlow上,無論如何,這是他們的v3策略,顯示了高頻率的前3個增強:

使用這3個谷歌大腦的數據增強最佳策略訓練你的網絡

學到的增強策略

  1. 增強改進了L2正則化的權重(數據增強是正則化的一種形式):這個結果與之前的工作一致,表明數據增強本身就是正則化的一種形式。


使用這3個谷歌大腦的數據增強最佳策略訓練你的網絡

  1. 學習到的增強策略對小目標和高精度特別有幫助:本文表明,使用增強策略對小目標的檢測精度特別有幫助。在某些情況下,跳轉高達60% (4.3 -> 7.1)!
使用這3個谷歌大腦的數據增強最佳策略訓練你的網絡

使用所學習到的增強策略後,物體檢測的精度有了提升

摘要:本文展示了對物體檢測模型(而不是使用與圖像分類相同的模型)進行優化訓練的特定的數據增強方法的重要性,併為指導訓練提供了最優策略。他們展示了使用這種學習策略在COCO數據集上訓練RetinaNet架構的最新結果。

即使你沒有使用它們的全部策略,僅知道前3個增強方案對於你在自己的物體檢測訓練(旋轉、均衡話、邊界框的Y移位)中使用它們也是非常重要的信息。

最後,本文繼續證明了最新的研究成果,即數據增強本質上為CNN模型提供了正則化。

英文原文:https://medium.com/@lessw/state-of-the-art-object-detection-use-these-top-3-data-augmentations-and-google-brains-optimal-57ac6d8d1de5

使用這3個谷歌大腦的數據增強最佳策略訓練你的網絡



分享到:


相關文章: