騰訊 AI Lab 正式開源業內最大規模多標籤圖像數據集

2018年10月17日,騰訊AI Lab宣佈正式開源“Tencent ML-Images”項目。該項目由多標籤圖像數據集ML-Images,以及業內目前同類深度學習模型中精度最高的深度殘差網絡ResNet-101構成。

該開源項目的主要內容包括:

ML-Images數據集的全部圖像URLs,以及相應的類別標註。出於原始圖像版權的考慮,此次開源將不直接提供原始圖像,用戶可利用我們提供的下載代碼和URLs自行下載圖像。ML-Images數據集的詳細介紹,包括圖像來源,圖像數量,類別數量,類別的語義標籤體系,標註方法,以及圖像的標註數量等統計量。完整的代碼和模型。我們提供的代碼涵蓋從圖像下載,圖像預處理,基於ML-Images的預訓練,基於ImageNet的遷移學習,到基於訓練所得模型的圖像特徵提取的完整流程。該項目提供了基於小數據集的訓練示例,以方便用戶快速體驗我們的訓練流程。該項目還提供了非常高精度的ResNet-101模型(在單標籤基準數據集ImageNet的驗證集上的top-1精度為80.73%)。用戶可根據自身需求,隨意選用該項目的代碼或模型。

“Tencent ML-Images”作為騰訊開源第58個項目(https://github.com/Tencent),是騰訊AI Lab在計算機視覺領域所累積的基礎能力的一次釋放,將為人工智能領域的科研人員和工程師提供充足的高質量訓練數據,及簡單易用、性能強大的深度學習模型。在工作中,ML-Images能為包括圖像、視頻等在內的視覺任務提供強大支撐,並助力圖像分類、物體檢測、物體跟蹤、語義分割等技術水平的提升,促進人工智能行業共同發展。


分享到:


相關文章: