Question 1

UnicodeとUTF-8の違いは？

Accepted Answer

Unicodeは世界中のすべての文字にユニークなコードポイントを割り当てた標準（例: U+AC00 = 가）で、UTF-8はそのコードポイントをバイトとして格納するエンコード方式の一つです。UTF-16やUTF-32もあります。

Question 2

サロゲートペアとは何ですか？

Accepted Answer

U+FFFF以上の補助文字（絵文字など）は4桁のUnicodeエスケープでは表現できません。上位サロゲート（U+D800～U+DBFF）と下位サロゲート（U+DC00～U+DFFF）の2つのコードユニットを組み合わせるサロゲートペア方式を使います。JSONやJavaで補助文字をエンコードする標準的な方法です。

Question 3

JSONでUnicodeエスケープは必須ですか？

Accepted Answer

いいえ。JSON仕様では非ASCII文字を\uXXXXでエスケープすることは任意です。UTF-8で保存すればそのまま使用できます。ただし、ASCII専用の環境やデバッグ時にはエスケープが便利です。

Question 4

ASCII文字もUnicodeですか？

Accepted Answer

はい。Unicodeの最初の128コードポイント（U+0000～U+007F）はASCIIと同一です。例えばAはU+0041、aはU+0061です。このツールはASCIIを含むすべての文字を\uXXXX形式にエンコードします。

Unicodeエンコーダー/デコーダー

計算方法

計算例

よくある質問

関連ツール

ASCIIエンコーダー/デコーダー

HTMLエンコーダー/デコーダー

Base64エンコーダー/デコーダー

URLエンコーダー/デコーダー

大文字小文字変換