Tools

Unicode 인코더/디코더

텍스트를 Unicode 이스케이프 시퀀스로 변환하거나 반대로 디코딩합니다.

계산 방법

Unicode 이스케이프는 문자를 \uXXXX 형식의 코드 포인트로 표현하는 방식입니다. 주로 다음과 같은 경우에 사용됩니다: • 프로그래밍에서 특수문자를 소스코드에 표현할 때 • JSON 데이터에서 비ASCII 문자를 인코딩할 때 • 국제화(i18n) 작업 시 인코딩 형식: • 기본 다국어 평면(BMP): \uXXXX (4자리 16진수) • 보충 문자(이모지 등): \uXXXX\uXXXX (서로게이트 페어, JSON/Java 호환) • 모든 문자(ASCII 포함)를 \uXXXX 형식으로 변환합니다. 디코딩 지원 형식: \uXXXX · \u{XXXXX}

계산 예시

입력: 안녕하세요 인코딩 결과: \uC548\uB155\uD558\uC138\uC694 입력: Hi! 인코딩 결과: \u0048\u0069\u0021

자주 묻는 질문

Unicode와 UTF-8의 차이는?
Unicode는 전 세계 모든 문자에 고유 코드 포인트를 부여한 표준(예: U+AC00 = 가)이고, UTF-8은 그 코드 포인트를 바이트로 저장하는 인코딩 방식 중 하나입니다. UTF-16, UTF-32도 있습니다.
서로게이트 페어란 무엇인가요?
이모지 등 U+FFFF 이상의 보충 문자는 4자리 유니코드 이스케이프로 표현할 수 없어, U+D800~U+DBFF(상위)와 U+DC00~U+DFFF(하위) 두 코드 유닛을 조합하는 서로게이트 페어 방식을 사용합니다. JSON과 Java에서 보충 문자를 인코딩하는 표준 방법입니다.
JSON에서 Unicode 이스케이프는 필수인가요?
JSON 사양에서 비ASCII 문자를 \uXXXX로 이스케이프하는 것은 선택사항입니다. UTF-8로 저장하면 그대로 사용해도 유효합니다. 하지만 ASCII-only 환경이나 디버깅 시 이스케이프가 유용합니다.
ASCII 문자도 Unicode인가요?
네. Unicode의 처음 128개 코드 포인트(U+0000~U+007F)는 ASCII와 동일합니다. 예를 들어 A는 U+0041, a는 U+0061입니다. 이 도구는 ASCII를 포함한 모든 문자를 \uXXXX 형식으로 인코딩합니다.

관련 도구