OCR テキスト抽出

画像からテキストをブラウザ上で直接抽出します。

🔍

画像をドラッグ＆ドロップまたはクリックしてアップロード

PNG・JPG・WebP・BMP・GIF対応

すべての処理はブラウザで行われます。画像がサーバーに送信されることはありません。

OCR（光学文字認識）とは？

• OCRは画像中のテキストをコンピュータが読み取れる文字に変換する技術です。 • このツールはTesseract.jsエンジンを使用し、100以上の言語をサポートします。 • WebAssemblyベースですべての処理がブラウザで行われ、画像が外部に送信されることはありません。 • 初回使用時に選択した言語の学習データをダウンロードします（4〜8MB）。以降はキャッシュされ高速に処理されます。

より良い結果のためのヒント

• 解像度の高い画像ほど認識率が高くなります。 • テキストが水平に配置された画像が最も正確です。 • 背景と文字のコントラストが高いほど良い結果が得られます。 • 日英混在の文書は「日本語 + 英語」の組み合わせを使用してください。 • 手書きより印刷文字の方がはるかに正確に認識されます。

よくある質問

画像はサーバーに送信されますか？

いいえ。すべてのOCR処理はWebAssemblyを通じてブラウザで直接行われます。画像がサーバーに送信されることはなく、インターネット接続は初回の言語データダウンロードにのみ必要です。

初回実行時に時間がかかるのはなぜですか？

選択した言語のOCR学習データ（4〜8MB）をダウンロードする必要があります。一度ダウンロードされたデータはブラウザにキャッシュされ、次回からは高速に実行されます。

日本語と英語が混在した文書はどうすればよいですか？

言語選択で「日本語 + English」の組み合わせを選択すると、両方の言語を同時に認識します。ただし言語を追加するほど処理時間が増加し、精度がやや低下する場合があります。

OCR テキスト抽出

OCR（光学文字認識）とは？

より良い結果のためのヒント

よくある質問

関連ツール

画像エディター

画像コンバーター

画像圧縮

画像リサイズ

画像クロップ