大小隻有8.6M!百度開源超輕量中英文OCR模型爆紅Github

開源最前線(ID:OpenSourceTop) 猿妹整編

項目地址:https://github.com/PaddlePaddle/PaddleOCR


光學字符識別(OCR)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然後用字符識別方法將形狀翻譯成計算機文字的過程。


前幾個月,猿妹曾和大家分享過一個熱門的中文OCR項目———chineseocr_lite。這兩天猿妹才知道,百度也開源了一款超輕量級中文OCR,總模型大小僅8.6M,只有chineseocr_lite,那真真是超輕量級別的神級OCR。


PaddleOCR旨在打造一套豐富、領先、且實用的OCR工具庫,助力使用者訓練出更好的模型,支持iOS和Android系統,功能如此齊全,難怪霸榜Github熱榜:


大小隻有8.6M!百度開源超輕量中英文OCR模型爆紅Github


PaddleOCR具有以下特性:

  • 超輕量級中文OCR模型,總模型僅8.6M
  • 實用通用中文OCR模型
  • 多種預測推理部署方案,包括服務部署和端側部署
  • 多種文本檢測訓練算法,EAST、DB
  • 多種文本識別訓練算法,Rosetta、CRNN、STAR-Net、RARE
  • 可運行於Linux、Windows、MacOS等多種系統


說了這麼多,還是一起來看看效果吧,先來看看通用中文OCR效果展示:


大小隻有8.6M!百度開源超輕量中英文OCR模型爆紅Github


再來看看超輕量級中文OCR效果展示,無論是橫排文字還是豎排文字,都是不在話下的,而且識別準確率相當高。


大小隻有8.6M!百度開源超輕量中英文OCR模型爆紅Github


當然你要說他零失誤那就有點誇張了,比如下面這一張,就出現了一個字識別錯誤:


大小隻有8.6M!百度開源超輕量中英文OCR模型爆紅Github


支持空格的中文OCR效果展示


大小隻有8.6M!百度開源超輕量中英文OCR模型爆紅Github


通用模型


大小隻有8.6M!百度開源超輕量中英文OCR模型爆紅Github


除了豐富的功能,文檔教程也是十分全面,不信你看:


大小隻有8.6M!百度開源超輕量中英文OCR模型爆紅Github


有什麼不懂的直接找文檔準沒錯,不知道百度開源的這款神器你粉了麼?最後附上Github地址:https://github.com/PaddlePaddle/PaddleOCR


分享到:


相關文章: