EasyOCR

EasyOCR은 문자 영역 인식(Detection), 문자 인식(Recognition)을 손쉽게 수행 할 수 있도록 하는 Python 패키지 입니다. EasyOCR은 구현이 간단하고 매우 직관적입니다. 현재 80개이상의 언어를 지원하고 있으며, 꾸준히 Releases 되고 있습니다. 최근에는 손글씨 인식을 목표로 하고 있습니다.

https://github.com/JaidedAI/EasyOCR (opens in a new tab)


선정이유

OCR 기술은 크게 문자의 영역을 검출하는 Text detection 그리고 검출된 영역의 문자를 인식하는 Text recognition으로 구분할 수 있다.

Text Detection

image

Text Recognition

image

EasyOCR은 Detection 과 Recongtion 두기능을 수행할 수 있으며, 사전학습이 가능하다는 점에서 해당 OCR을 선택하였다.


모델 파인튜닝

EasyOCR의 사전학습은 아래 깃허브 링크에 설명되어있다.

Text Recongnition

https://github.com/JaidedAI/EasyOCR/blob/master/custom_model.md (opens in a new tab)

Text Detection

https://github.com/JaidedAI/EasyOCR/blob/master/trainer/craft/README.md (opens in a new tab)