Tools

OCR 텍스트 추출

이미지에서 텍스트를 브라우저에서 바로 추출합니다.

🔍

이미지를 드래그하거나 클릭하여 업로드

PNG, JPG, WebP, BMP, GIF 지원

모든 처리는 브라우저에서 이루어집니다. 이미지가 서버로 전송되지 않습니다.

OCR(광학 문자 인식)이란?

• OCR은 이미지 속 텍스트를 컴퓨터가 읽을 수 있는 문자로 변환하는 기술입니다. • 이 도구는 Tesseract.js 엔진을 사용하며, 100개 이상의 언어를 지원합니다. • WebAssembly 기반으로 모든 처리가 브라우저에서 이루어져 이미지가 외부로 전송되지 않습니다. • 처음 사용 시 선택한 언어의 학습 데이터를 다운로드합니다 (4~8MB). 이후에는 캐시되어 빠르게 처리됩니다.

더 좋은 결과를 위한 팁

• 해상도가 높은 이미지일수록 인식률이 높습니다. • 텍스트가 수평으로 정렬된 이미지가 가장 정확합니다. • 배경과 글자의 대비가 클수록 좋습니다. • 한영 혼용 문서는 "한국어 + English" 조합을 사용하세요. • 손글씨보다 인쇄체가 훨씬 정확하게 인식됩니다.

자주 묻는 질문

이미지가 서버로 전송되나요?
아닙니다. 모든 OCR 처리는 WebAssembly를 통해 브라우저에서 직접 이루어집니다. 이미지가 서버로 전송되지 않으며, 인터넷 연결은 최초 언어 데이터 다운로드에만 필요합니다.
처음 실행 시 왜 시간이 걸리나요?
선택한 언어의 OCR 학습 데이터(4~8MB)를 다운로드해야 합니다. 한 번 다운로드된 데이터는 브라우저에 캐시되어 다음부터는 빠르게 실행됩니다.
한글과 영어가 섞인 문서는 어떻게 하나요?
언어 선택에서 "한국어 + English" 조합을 선택하면 두 언어를 동시에 인식합니다. 다만 언어를 추가할수록 처리 시간이 늘어나고 정확도가 약간 낮아질 수 있습니다.

관련 도구