'포트폴리오/연구실'에 해당되는 글 1건

반응형

1. OCR 이란?

->    정식명칭은 Optical character recognition의 약자로 광학문자인식기능으로 

쉽게말해 이미지로부터 문자 추출하거나 인식하는데 쓰인다.



2. OCR 한글 

->    조사해본 결과 영어는 OCR 라이브러리들이 많이 존재하며 인식률도 높으나,

한글을 지원하는 라이브러리는 많이 존재하지 않으며, 인식률도 상당히 낮은편.


오픈소스로는 Tesseract 라는 라이브러리가 한글 인식률이 가장 높다고 알려져있으며,

상용제품으로는 Abbyy사의 FindReader 라는 제품이 평이 가장 좋음.


3. 테스트

->    테스트 이미지는 웹에서 얻은 교재 스캔본을 가지고 화질별로 나누어 시행


Tesseract(테서렉트)

※  실제 테서렉트기반으로 네이버에서 서비스하는 사이트(http://t.lab.naver.com/ocr/)를 가지고 테스트 





Tesseract 실험 결과


-> 인식률이 상당히 저조하여 아직 활용하기 부족한 수준.

뒤에 배경이 들어간경우 아에 인식자체를 못하는 것을 볼 수 있다.




FindReader (상용제품)





FindReader 실험 결과


-> 역시 상용제품이라 그런지 인식률 뿐만아니라, 원래 문서의 형태를 복구하는 기능도 포함하고 있다.

텍스트는 텍스트대로, 이미지는 이미지대로 인식하여, 여러형태의 문서저장기능도 지원하고 있다.





4. 결론

->    라이브러리 형태로 제공되는 Tesseract가 개발시 활용측면에서는 유리하나, 

      실험에서 교재 스캔본을 사용했기때문에 어느정도 양호한 수준의 텍스트들이었음에도 불구하고

      인식률이나 완성도를 볼때 아직 사용하기는 이른 수준이 아닌가 싶다.





반응형
블로그 이미지

cocy

조금은 가볍게! 시작은 새롭게!

,