无需登录 数据私有 本地保存

二进制信息编码器 - 将文字变成01流

16
0
0
0

二进制信息编码器

将文字转换为01二进制流,支持 UTF-8 / ASCII / UTF-16 多种编码格式

字符数:0
字符数:0 字节数:0 比特数:0 编码:UTF-8

# 字符 Unicode 二进制 十六进制 字节数
有效比特数:0

常见问题与知识点

二进制编码是将文字、数字等信息转换为仅由0和1组成的序列。计算机的底层电路使用高/低电平(开/关)来表示信息,二进制是其最自然的表达方式。每个0或1称为一个比特(bit),8个比特组成一个字节(byte)。通过不同的编码标准(如UTF-8、ASCII),我们可以用二进制表示世界上几乎所有的文字符号。

  • ASCII:仅支持128个字符(英文字母、数字、基本符号),每个字符固定使用1字节(8比特)。简单但无法表示中文等非拉丁文字。
  • UTF-8:变长编码,ASCII字符用1字节,中文常用字用3字节,emoji等用4字节。兼容ASCII,是互联网最广泛使用的编码。
  • UTF-16:基本字符用2字节(16比特),补充字符用4字节(代理对)。是JavaScript和许多操作系统内部的默认编码。

将二进制转回文字需要知道编码方式:

  1. 确认二进制数据使用的编码(UTF-8/ASCII/UTF-16)
  2. 按编码规则将二进制分组(如UTF-8按8位一组解析,UTF-16按16位一组)
  3. 将每组二进制转换为对应的字节值
  4. 根据编码表将字节序列映射回字符

本工具的"二进制→文本"标签页可以自动完成这一过程,只需粘贴二进制数据并选择正确的编码方式即可。

取决于编码方式:

  • UTF-8:常用中文字符占3字节(24比特),生僻字可能占4字节(32比特)
  • UTF-16:基本多语言平面内的中文字符占2字节(16比特),少数补充字符占4字节
  • ASCII无法表示中文字符

这就是为什么纯英文文本文件通常比中文文本文件小的原因——每个英文字母在UTF-8中仅需1字节。

1字节 = 8比特。比特是信息的最小单位,表示0或1。字节是计算机存储的基本单位。互联网速度通常以比特每秒(bps)计量,而文件大小以字节(B)计量。例如:

  • 1 KB = 1024 字节 = 8192 比特
  • 1 MB = 约100万字节
  • 一个英文字母 = 1字节(UTF-8/ASCII)
  • 一个中文汉字 ≈ 3字节(UTF-8)

UTF-8的优势:

  • 向后兼容ASCII:所有ASCII文本同时也是有效的UTF-8文本
  • 节省空间:对于英文内容,UTF-8比UTF-16节省一半空间
  • 无字节序问题:UTF-8以字节为单位,不存在大端/小端的歧义
  • 容错性强:即使部分字节损坏,也容易定位下一个字符的边界
  • 广泛支持:几乎所有现代系统和协议都原生支持UTF-8

  • 网络传输:数据在网络上以二进制形式传输
  • 文件存储:所有文件(文本、图片、视频)底层都是二进制
  • 加密算法:加密操作在二进制层面进行
  • 数据压缩:压缩算法直接操作二进制数据
  • 嵌入式系统:单片机等设备直接处理二进制指令
  • 调试与逆向工程:分析二进制数据是安全研究的基础
  • 教育学习:理解二进制是学习计算机科学的第一步