OCR 텍스트 추출
이미지에서 텍스트를 브라우저에서 바로 추출합니다.
🔍
이미지를 드래그하거나 클릭하여 업로드
PNG, JPG, WebP, BMP, GIF 지원
모든 처리는 브라우저에서 이루어집니다. 이미지가 서버로 전송되지 않습니다.
OCR(광학 문자 인식)이란?
• OCR은 이미지 속 텍스트를 컴퓨터가 읽을 수 있는 문자로 변환하는 기술입니다.
• 이 도구는 Tesseract.js 엔진을 사용하며, 100개 이상의 언어를 지원합니다.
• WebAssembly 기반으로 모든 처리가 브라우저에서 이루어져 이미지가 외부로 전송되지 않습니다.
• 처음 사용 시 선택한 언어의 학습 데이터를 다운로드합니다 (4~8MB). 이후에는 캐시되어 빠르게 처리됩니다.
더 좋은 결과를 위한 팁
자주 묻는 질문
이미지가 서버로 전송되나요?
아닙니다. 모든 OCR 처리는 WebAssembly를 통해 브라우저에서 직접 이루어집니다. 이미지가 서버로 전송되지 않으며, 인터넷 연결은 최초 언어 데이터 다운로드에만 필요합니다.
처음 실행 시 왜 시간이 걸리나요?
선택한 언어의 OCR 학습 데이터(4~8MB)를 다운로드해야 합니다. 한 번 다운로드된 데이터는 브라우저에 캐시되어 다음부터는 빠르게 실행됩니다.
한글과 영어가 섞인 문서는 어떻게 하나요?
언어 선택에서 "한국어 + English" 조합을 선택하면 두 언어를 동시에 인식합니다. 다만 언어를 추가할수록 처리 시간이 늘어나고 정확도가 약간 낮아질 수 있습니다.