Tools

OCR テキスト抽出

画像からテキストをブラウザ上で直接抽出します。

🔍

画像をドラッグ&ドロップまたはクリックしてアップロード

PNG・JPG・WebP・BMP・GIF対応

すべての処理はブラウザで行われます。画像がサーバーに送信されることはありません。

OCR(光学文字認識)とは?

• OCRは画像中のテキストをコンピュータが読み取れる文字に変換する技術です。 • このツールはTesseract.jsエンジンを使用し、100以上の言語をサポートします。 • WebAssemblyベースですべての処理がブラウザで行われ、画像が外部に送信されることはありません。 • 初回使用時に選択した言語の学習データをダウンロードします(4〜8MB)。以降はキャッシュされ高速に処理されます。

より良い結果のためのヒント

• 解像度の高い画像ほど認識率が高くなります。 • テキストが水平に配置された画像が最も正確です。 • 背景と文字のコントラストが高いほど良い結果が得られます。 • 日英混在の文書は「日本語 + 英語」の組み合わせを使用してください。 • 手書きより印刷文字の方がはるかに正確に認識されます。

よくある質問

画像はサーバーに送信されますか?
いいえ。すべてのOCR処理はWebAssemblyを通じてブラウザで直接行われます。画像がサーバーに送信されることはなく、インターネット接続は初回の言語データダウンロードにのみ必要です。
初回実行時に時間がかかるのはなぜですか?
選択した言語のOCR学習データ(4〜8MB)をダウンロードする必要があります。一度ダウンロードされたデータはブラウザにキャッシュされ、次回からは高速に実行されます。
日本語と英語が混在した文書はどうすればよいですか?
言語選択で「日本語 + English」の組み合わせを選択すると、両方の言語を同時に認識します。ただし言語を追加するほど処理時間が増加し、精度がやや低下する場合があります。

関連ツール