什么是 Unicode 转义序列?
Unicode 转义序列是以 \u 开头后跟四个十六进制数字的编码方式,用于在 JSON 或源码中表示非 ASCII 字符。例如「中」的 Unicode 转义为 \u4e2d,「😀」的转义为 \ud83d\ude00。
为什么需要 Unicode 转义?
在 JSON 数据交换、国际化开发、日志输出等场景中,Unicode 转义可以确保非 ASCII 字符在各种编码环境下正确传输和显示。许多 API 和系统要求或推荐使用转义后的 Unicode 序列。
所有字符都会被转义吗?
不会。只有非 ASCII 字符(码位大于 U+007F 的字符)会被转义为 \uXXXX 格式。ASCII 字符(如字母、数字、常见标点)保持原样,不会进行转义。
Emoji 是如何转义的?
Emoji 等超出基本多语言平面(BMP)的字符使用代理对(Surrogate Pair)表示,即用两个 \uXXXX 序列来表示一个 Emoji 字符。例如 😀 转义为 \ud83d\ude00。
转义后的内容还是有效的 JSON 吗?
是的。\uXXXX 格式是 JSON 规范中定义的标准转义形式,经过转义后的内容仍然是合法的 JSON 字符串,可以被标准 JSON 解析器正确解析。