OCR テキスト抽出
画像からテキストをブラウザ上で直接抽出します。
🔍
画像をドラッグ&ドロップまたはクリックしてアップロード
PNG・JPG・WebP・BMP・GIF対応
すべての処理はブラウザで行われます。画像がサーバーに送信されることはありません。
OCR(光学文字認識)とは?
• OCRは画像中のテキストをコンピュータが読み取れる文字に変換する技術です。
• このツールはTesseract.jsエンジンを使用し、100以上の言語をサポートします。
• WebAssemblyベースですべての処理がブラウザで行われ、画像が外部に送信されることはありません。
• 初回使用時に選択した言語の学習データをダウンロードします(4〜8MB)。以降はキャッシュされ高速に処理されます。
より良い結果のためのヒント
よくある質問
画像はサーバーに送信されますか?
いいえ。すべてのOCR処理はWebAssemblyを通じてブラウザで直接行われます。画像がサーバーに送信されることはなく、インターネット接続は初回の言語データダウンロードにのみ必要です。
初回実行時に時間がかかるのはなぜですか?
選択した言語のOCR学習データ(4〜8MB)をダウンロードする必要があります。一度ダウンロードされたデータはブラウザにキャッシュされ、次回からは高速に実行されます。
日本語と英語が混在した文書はどうすればよいですか?
言語選択で「日本語 + English」の組み合わせを選択すると、両方の言語を同時に認識します。ただし言語を追加するほど処理時間が増加し、精度がやや低下する場合があります。