UTF-16编码解码工具 - 字符与十六进制序列互转

开发工具编码解码 UTF-16 编码解码

125

UTF-16 编码 / 解码工具

字符与十六进制序列互转 · 支持代理对 · LE/BE字节序 · 多种输出格式

文本输入 0 字符

编码 →

UTF-16 十六进制 0 字节

字节序：输出格式： * 字节序影响基于字节的输出格式

字符数：0 BMP字符：0 补充字符：0 UTF-16字节数：0 码元数(16位)：0

常见问题与知识点

UTF-16（16-bit Unicode Transformation Format）是一种变长字符编码，使用1个或2个16位码元来表示Unicode字符。

• BMP字符（基本多文种平面，U+0000 ~ U+FFFF）：使用1个16位码元（2字节）表示，如英文字母、中文汉字等。
• 补充字符（U+10000 ~ U+10FFFF）：使用2个16位码元（代理对）（共4字节）表示，如emoji表情😀、𠮷等生僻汉字。

UTF-16是Java、JavaScript（内部）、Windows NT等系统的核心编码方式。

字节序（Byte Order）决定了16位码元在内存中的字节排列顺序：

• UTF-16LE（小端序）：低位字节在前。如字符U+0048（H）存储为48 00。
• UTF-16BE（大端序）：高位字节在前。如字符U+0048（H）存储为00 48。

BOM（字节顺序标记）是放在文本开头的特殊标记U+FEFF：
• UTF-16LE的BOM：FF FE
• UTF-16BE的BOM：FE FF

BOM帮助解码器自动识别字节序。Windows系统通常使用UTF-16LE，网络传输通常使用UTF-16BE。

对于超出BMP范围的Unicode字符（码点 > U+FFFF，如emoji、部分生僻汉字），UTF-16使用代理对机制：

• 高代理（High Surrogate）：范围 U+D800 ~ U+DBFF（共1024个值）
• 低代理（Low Surrogate）：范围 U+DC00 ~ U+DFFF（共1024个值）

编码公式（码点 → 代理对）：
高代理 = 0xD800 + ((码点 - 0x10000) >> 10)
低代理 = 0xDC00 + ((码点 - 0x10000) & 0x3FF)

解码公式（代理对 → 码点）：
码点 = 0x10000 + ((高代理 - 0xD800) << 10) + (低代理 - 0xDC00)

代理对使得UTF-16能够表示超过100万个字符。

特性	UTF-8	UTF-16
编码单元	1字节（8位）	2字节（16位）
ASCII字符	1字节	2字节
中文汉字	3字节	2字节
Emoji	4字节	4字节
字节序问题	无	有（LE/BE）
适用场景	网络传输、存储、HTML	内存处理、Windows API、Java

UTF-16适合处理以亚洲文字为主的文本（中文、日文、韩文在UTF-16中仅需2字节，而在UTF-8中需3字节），也是许多编程语言和操作系统的内部编码。

识别UTF-16编码的常用方法：

1. 检查BOM：如果数据以FF FE或FE FF开头，则几乎可以确定是UTF-16编码。
2. 字节模式分析：对于英文文本，UTF-16编码会呈现"每隔一个字节为00"的模式（如48 00 65 00 6C 00即"Hel"）。
3. 代理对检测：检查是否存在合法的代理对序列（高代理后跟低代理）。
4. 统计方法：分析双字节值的分布是否符合Unicode字符的常见范围。

大多数文本编辑器（如VS Code、Notepad++）会自动检测BOM并选择正确的解码方式。

文本转十六进制工具 - 字符串转HEX编码

将普通字符串转换为十六进制表示，支持字节间分隔符自定义，便于开发调试。

文本处理十六进制文本编码

热门

字谜画谜生成器 - 文本符号拼凑

将单词或短句用相似读音的数字/符号替换，创造趣味字谜，可导出图片分享。

创作字谜文字生成画谜

热门

猪圈密码在线工具 - 图形符号替加密/解密

使用经典的猪圈密码（Pigpen Cipher）将字母替换为格子中的点线图形，交互式加密解密。

加密解密古典猪圈密码符号

热门

卡诺图在线化简器 - 二至六变量逻辑最小化

交互式填写卡诺图，自动寻找质蕴含项并输出最简与或式，数字逻辑课程利器。

教育工具化简卡诺图电路逻辑

热门

数字密室逃脱谜题生成 - 随机组合数学/密码

自动生成几道典型的数字或密码谜题（如摩斯电码、数独），用于自制密室。

游戏工具密室逃脱生成谜题

像素填色挑战 - 按数字填色绘图

在带编号的像素网格中点击颜色填充，一键溢出相同数字区域，完成可爱像素画。

休闲像素填色放松游戏

热门

罗马数字算术器 - 加减法直接运算

输入两个罗马数字，进行加或减运算，并输出罗马数字结果。

计算工具算术罗马数字计算

无障碍进度条组件生成器 - 确定/不确定状态

生成带有 ARIA 进度条角色的组件，支持确定和不确定两种样式。

无障碍 ARIA 无障碍进度进度条

HEX转RGBA工具 - 透明度叠加快速转换

将Hex颜色值加上透明度百分比转换为rgba()或8位Hex格式，精确控制颜色透明。

前端设计 HEX RGBA 转换

CSS注释移除器 - 清理样式表冗余

快速去除CSS中的注释块，可选保留或移除，轻量化样式代码。

优化工具 CSS 注释清理

CSS压缩工具 - 在线精简样式表文件

删除CSS中的注释、空格和换行，极致压缩代码体积，提升页面加载速度。

优化工具 CSS 优化压缩

设备内存检测 - navigator.deviceMemory查询

通过Navigator API读取设备RAM近似值（GB），同时显示硬件并发数，了解客户端性能。

开发工具内存检测硬件

热门

文本相似度计算器 - 余弦相似度

输入两段英文文本，通过词频向量计算余弦相似度，衡量内容相近程度。

开发工具余弦文本相似度

PlantUML 编码解码器 - 在线生成图表链接

输入 PlantUML 文本，编码为可嵌入图片的 URL 或解码已有的 PlantUML 链接查看源码。

可视化 PlantUML 图表编码解码

热门

Windows-1252 编码解码器 - 解决乱码问题

将错误解码的 Windows-1252 文本重新编码为正确的字符，修复常见的西文乱码。

文本工具 Windows-1252 乱码修复编码

PEM证书详细解码器 - 在线查看X.509字段

粘贴Base64编码的PEM证书，解码并显示颁发者、有效期、公钥算法与指纹等信息。

安全工具 PEM X.509 解码证书

热门

CTF 杂项编解码工具箱 - 丰富格式按层解开

集成ASCII/Hex/Base家族/Quoted-Printable/UUencode等多种编码一键互转，支持智能识别与链式解码。

CTF CTF 工具箱编码解码

热门

Protobuf 在线解码器 - 原始字节转可读结构

输入Proto定义和Base64编码的protobuf数据，在线解码为JSON，辅助分析二进制通信内容。

开发工具 Protobuf 二进制序列化解码

SAML 断言可视化工具 - 解码并查看身份声明

粘贴Base64编码的SAML Response，解码并格式化显示其中的属性、断言与签名信息，便于调试。

安全工具 SAML 断言解码身份

yEnc编码解码工具 - Usenet二进制附件格式

演示yEnc编码如何将8位二进制转换为适合新闻组的7位文本，并提供解码还原。

编码解码 yEnc 二进制编码

图像隐写解码器 - 最低有效位LSB提取

上传疑似隐写图片，提取每个像素的最低位，尝试恢复隐藏的文本或数据。

图像工具图片解码隐写术

敲击密码编码器 - 基于5x5网格的古典加密

将字母转换为敲击序列（叩叩声）的密码方案，适用于隐蔽通信学习。

加解密古典敲击密码编码

二进制信息编码器 - 将文字变成01流

将任意文本逐字符转换为二进制表示，同时可生成ASCII艺术式的二进制块。

教育工具二进制文本编码

热门

文本乱码修复器 - 检测编码错误并尝试恢复

粘贴乱码文本，自动检测可能的编码混淆（如UTF-8读GBK），并尝试还原正确文字。

开发工具乱码修复编码

手动条码解码学习 - 根据黑白条计算数字

展示Code128等条码的条空模式，逐步教您如何手动计算出编码的数字。

开发工具学习条码解码

热门

Base64URL编码解码 - URL安全的Base64变体

在线Base64URL编码与解码，替换+/-为-/_并去除=填充，专为URL和JWT等场景优化。

开发工具 Base64URL 编码解码

Base58编码解码工具 - 无模糊字符的编码格式

在线Base58编码与解码，剔除易混淆字符（0、O、l、I），常用于比特币地址和短链接。

开发工具 Base58 编码解码

热门

UUEncode编码解码工具 - 经典Unix文本转送格式

在线UUEncode与UUDecode，文本与二进制转换的古老编码，兼容Unix传送历史格式。

开发工具 UUEncode 二进制编码

Quoted-Printable编码解码 - 邮件安全传输格式

在线Quoted-Printable编码与解码工具，用于邮件MIME格式的可打印字符转义，前端安全运行。

开发工具 Quoted-Printable 编码邮件

热门

Punycode编码转换工具 - 国际化域名在线解码

将非ASCII域名（如中文域名）转换为Punycode格式或还原，理解国际化域名编码机制。

编码解码 Punycode 域名编码

UTF-16编码解码工具 - 字符与十六进制序列互转