Unicode エスケープシーケンスとは?
Unicode エスケープシーケンスは \u に続く4桁の16進数で非 ASCII 文字を表現する形式です。例えば漢字の「中」は \u4e2d、絵文字「😀」は \ud83d\ude00 とエスケープされます。
なぜ Unicode エスケープを使うのですか?
JSON データ交換や国際化開発において、異なるエンコード環境でも非 ASCII 文字を正しく送受信・表示するために使用します。多くの API やシステムで推奨されています。
すべての文字がエスケープされますか?
いいえ。非 ASCII 文字(U+007F より上のコードポイント)のみがエスケープされます。英数字や一般的な記号などの ASCII 文字はそのまま保持されます。
絵文字はどのようにエスケープされますか?
基本多言語面(BMP)外の絵文字などはサロゲートペアで表現され、2つの \uXXXX シーケンスに変換されます。例:😀 → \ud83d\ude00。
エスケープ後の内容は有効な JSON ですか?
はい。\uXXXX 形式は JSON 仕様で定義された標準エスケープであり、エスケープ後も有効な JSON 文字列として解析可能です。