圖像增強 DewarpNet
DewarpNet,這是一個把未掃描圖片轉成類似掃描形式的圖片的神經網絡。
通過DewarpNet能夠提高OCR的效率。
訓練:需要準備數據train.txt,val.txt,其格式如下:
1/824_8-cp_Page_0503-7Ns0001 1/824_1-cp_Page_0504-2Cw0001
Train Shape Network: python trainwc.py --arch unetnc --data_path ./data/DewarpNet/doc3d/ --batch_size 50 --tboard Train Texture Mapping Network: python trainbm.py --arch dnetccnl --img_rows 128 --img_cols 128 --img_norm --n_epoch 250 --batch_size 50 --l_rate 0.0001 --tboard --data_path ./DewarpNet/doc3d
數據集:
所用的數據集是doc3D數據集,位置在https://github.com/cvlab-stonybrook/doc3D-dataset
代碼github位置:https://github.com/cvlab-stonybrook/DewarpNet