无需登录 数据私有 本地保存

Unicode规范化工具 - NFC/NFD转换

18
0
0
0

Unicode规范化工具 – NFC/NFD转换

输入任意Unicode文本,选择规范化形式,即时转换。支持NFC、NFD、NFKC、NFKD,本地运算,安全私密。

规范化形式:
已复制到剪贴板!

关于Unicode规范化

同一字符在Unicode中可能由多种码点序列表示。规范化把这些表示统一成标准形式,以确保文本比较、搜索和存储的一致性。

  • NFC组合形式 – 优先使用组合字符,最短形式。网页、文件名推荐使用。
  • NFD分解形式 – 将组合字符拆分为基本字符+附加符号,便于字符级处理。
  • NFKC兼容组合 – 在NFC基础上替换兼容字符(如全角→半角)。可能改变视觉长度。
  • NFKD兼容分解 – 在NFD基础上进行兼容替换,分解程度最高。

常见问题

NFC是组合形式,比如“é”用一个码点(U+00E9)表示;NFD是分解形式,用“e”(U+0065)加组合尖音符(U+0301)表示。大多数系统(如macOS、Linux)默认使用NFC,而某些旧系统或特殊场景可能使用NFD。

当你需要消除兼容性差异时使用它们,例如把全角英文字母“A”转换成半角“A”,或者把连字“fi”规范成“fi”。常用于搜索引擎预处理、密码规范化或文本消歧,但请注意它们可能改变文本的视觉呈现和长度。

完全不会。转换在您的浏览器本地进行,利用JavaScript的String.prototype.normalize()方法,无需联网,您的文本不会离开设备。

不会。规范化只处理字符的组成方式,不影响大小写。但NFKC/NFKD可能会将某些字母形状符号(如“K”)转换成普通字母“K”,这属于兼容等价转换。

因为不同规范化形式下,字符的码点数量不同。例如“é”在NFD下是两个码点(e + 组合重音符),在NFC下是一个码点。长度变化是正常现象。