귀찮아서가끔하는블로그

[python] easyocr 사용해보기 본문

Python

[python] easyocr 사용해보기

Y-unknow94 2022. 6. 29. 20:41
반응형

easyocr 사용해보기


easyocr을 사용하기 전에 OCR이 무엇인지 알아보자

 

OCR이란?

보통 컴퓨터가 2진법(0/1) 데이터를 폰트를 통해 인간이 인식할 수 있는 형태로 글자를 보여 준다면, OCR은 그 반대로 인간이 종이 위에 써 놓은 글씨를 인지하여 텍스트 데이터로 치환한다. 보통은 스캐너로 읽어들인 이미지 파일을 분석하여 텍스트나 워드 파일로 결과물을 내놓는다.

출처 : 나무위키

 

ocr이 무엇인지 알아보았으니 ocr을 쉽게 사용할 수 있는 easyocr을 사용해보자

 

1. easyocr 설치하기

easyocr을 설치하는 방법으로는 두가지가 있다. 필자는 1번 방법으로 설치하여 사용하였다.

1번 방법

pip install easyocr

 

2번 방법 easyocr 설치하기 - git

pip install git+git://github.com/jaidedai/easyocr.git

2. 코드 작성하기

설치가 완료되었으면 간단한 코드를 작성해보도록 하자

import easyocr
reader = easyocr.Reader(['ko','en'], gpu=False) ##한글,영어를 인식하고 gpu를 사용하지 않는다.
result = reader.readtext(filePath) ##filePath는 이미지 경로를 넣어주면 된다.

print('result : ',result)

3. 실행하여 이미지의 텍스트 추출하기

필자가 추출할 이미지는 다음과 같다

추출 결과는 다음과 같다

알아보기 힘드니 다음과 같은 코드를 추가하여 텍스트만 출력해보자

import easyocr
reader = easyocr.Reader(['ko','en'], gpu=False) ##한글,영어를 인식하고 gpu를 사용하지 않는다.
result = reader.readtext('images/test1.jpg') ##filePath는 이미지 경로를 넣어주면 된다.
txts = [line[1] for line in result] ##텍스트만 가져오기

print('txts : ',txts)

텍스트 추출 결과

정확하게 잘 나오는 것을 확인할 수 있다.

 

참고사이트
반응형
Comments