github資源推薦:目標姿態檢測數據集與渲染方法

標準化數據集在多媒體研究中至關重要。今天,我們要給大家推薦一個彙總了姿態檢測數據集和渲染方法的 github repo。

項目地址:https://github.com/YoungXIAO13/ObjectPoseEstimationDatasets

這個數據集彙總了用於對象姿態估計的數據集,以及生成合成訓練數據的呈現方法。在下表中,3D CAD 模型表示為模型,2D 圖像表示為對象。

該項目分為四個部分:

  • 受控環境中的對象

  • 野外物體

  • 3D 模型數據集

  • 渲染方法

受控環境中的對象

此表列出了通常稱為 BOP:Benchmark 6D 對象姿態估計的數據集,該數據集提供精確的 3D 對象模型和精確的 2D~3D 對齊。

可以下載所有 BOP 數據集,並使用作者提供的工具箱。

使用項目上面的代碼 ply2obj.py 將原始 .ply 文件轉換為 .obj 文件,並運行 create_annotation.py 為數據集中的所有場景創建一個註釋文件。

github资源推荐:目标姿态检测数据集与渲染方法
github资源推荐:目标姿态检测数据集与渲染方法

以上數據集的下載地址:

  • HomebrewedDB:https://bop.felk.cvut.cz/datasets/

  • YCB-Video:https://rse-lab.cs.washington.edu/projects/posecnn/

  • T-LESS:https://bop.felk.cvut.cz/datasets/

  • Doumanoglou:https://bop.felk.cvut.cz/datasets/

  • Tejani:https://bop.felk.cvut.cz/datasets/

  • Occluded-LINEMOD:https://bop.felk.cvut.cz/datasets/

  • LINEMOD:https://bop.felk.cvut.cz/datasets/

野外物體

在該表中, Pix3D 和 ScanNet 提供精確的 2D-3D 對齊,而其他僅提供粗略的對齊。

PASCAL3D+ 是用於視點估計的事實基準。

ScanNet 通常用來評估場景重建和分割。

github资源推荐:目标姿态检测数据集与渲染方法
github资源推荐:目标姿态检测数据集与渲染方法

數據集下載地址:

  • ApolloCar3D:http://apolloscape.auto/car_instance.html

  • Pix3D:http://pix3d.csail.mit.edu/

  • ScanNet:http://www.scan-net.org/

  • ObjectNet3D:http://cvgl.stanford.edu/projects/objectnet3d/

  • PASCAL3D+:http://cvgl.stanford.edu/projects/pascal3d.html

  • KITTI:http://www.cvlibs.net/datasets/kitti/eval_object.php

3D 模型數據集

為了驗證網絡泛化能力,可以使用以下數據集生成合成訓練數據。請注意,ABC 包含通用和任意的工業 CAD 型,而 ShapeNetCore 和 ModelNet 包含常見類別的對象,如汽車和椅子。

github资源推荐:目标姿态检测数据集与渲染方法

數據集地址:

  • ABC:https://deep-geometry.github.io/abc-dataset/

  • ShapeNetCore:https://www.shapenet.org/download/shapenetcore

  • ModelNet-40:http://modelnet.cs.princeton.edu/

渲染方法

  • 可微渲染

這裡有兩篇參考論文:CVPR 2018 論文《Neural 3D Mesh Renderer》和 NIPS 2018 論文《RenderNet》。

  • Blender Render 渲染

本 repo 提供了相關的 python 代碼,以使用 Blender 作為一個易於安裝和生成照片級真實圖像的 python 模塊,從 3D 模型生成渲染圖像。

你可以在這裡找到更多關於使用它的方法。

  • 物理模擬器

Pybullet是機器人界非常受歡迎的一個物理模擬器。

  • 其他

Glumpy:不支持無頭渲染(在 ssh 模式下會失敗)

UnrealCV:Unreal Engine 4 的擴展,幫助與虛擬世界交互並與外部程序通信。

合成計算機視覺:恢復許多用於生成合成圖像的技術

via:https://github.com/YoungXIAO13/ObjectPoseEstimationDatasets

雷鋒網網雷鋒網雷鋒網


分享到:


相關文章: