유니코드 언이스케이프 시퀀스란?
유니코드 언이스케이프 시퀀스는 \u로 시작하고 네 자리 16진수가 뒤따르는 형식으로, JSON에서 비ASCII 문자를 나타내는 데 사용됩니다. 예: 중국어 «中» → \u4e2d, 이모지 «😀» → \ud83d\ude00.
유니코드 언이스케이프를 사용하는 이유는?
유니코드 언이스케이프는 JSON 데이터 교환 및 국제화 개발 시 다양한 인코딩 환경에서 비ASCII 문자가 올바르게 전송되고 표시되도록 보장합니다.
모든 문자가 언이스케이프되나요?
아니요. 비ASCII 문자(U+007F 초과 코드 포인트)만 언이스케이프됩니다. 문자와 숫자 같은 ASCII 문자는 변경되지 않습니다.
이모지는 어떻게 언이스케이프되나요?
기본 다국어 평면(BMP) 밖의 이모지와 문자는 서로게이트 쌍으로 표현됩니다 — 하나의 이모지에 두 개의 \uXXXX 시퀀스. 예: 😀 → \ud83d\ude00.
언이스케이프된 콘텐츠도 유효한 JSON인가요?
네. \uXXXX 형식은 JSON 사양에 정의된 표준 언이스케이프입니다. 언이스케이프된 콘텐츠는 모든 표준 파서가 처리할 수 있는 유효한 JSON 문자열로 유지됩니다.