高级字符编码检测器 - 自动识别文件编码

高级字符编码检测器

自动识别文件编码，支持 UTF-8、GBK、BIG5、Shift_JIS、EUC-KR 等 20+ 种编码

拖拽文件到此处或点击上传

支持所有文件类型 · 最大 50MB · 检测前 1MB 用于分析

常见问题

什么是字符编码？为什么需要检测文件编码？

字符编码是将字符（如字母、汉字）映射为计算机可存储的字节序列的规则。不同的编码标准（如 UTF-8、GBK、BIG5）使用不同的映射方式。当用错误的编码打开文件时，就会出现乱码。编码检测工具可以自动分析文件的字节特征，推断出正确的编码方式，帮助您正确打开和转换文件。常见场景包括：处理从网上下载的文本文件、导入CSV数据、修复乱码文档等。

BOM（字节顺序标记）是什么？它对编码检测有什么帮助？

BOM（Byte Order Mark）是文件开头的几个特殊字节，用于标识文件的编码方式：

EF BB BF → UTF-8（带BOM）
FF FE → UTF-16 LE（小端序）
FE FF → UTF-16 BE（大端序）
FF FE 00 00 → UTF-32 LE
00 00 FE FF → UTF-32 BE

如果文件包含BOM，编码检测几乎可以100%确定。但很多UTF-8文件（尤其是Linux/Web环境中）不带BOM，这时就需要通过分析字节模式来检测。

为什么我的GBK文件有时被误识别为UTF-8？

GBK编码的中文字符使用两个字节表示，其中第一个字节在 0x81-0xFE 范围。这些字节序列有可能恰好也符合UTF-8的多字节序列格式（尽管概率较低）。对于较短的文本，这种巧合更容易发生。本工具使用多种启发式算法综合分析，包括字节对模式匹配、解码试探和字符分布统计，最大程度减少误判。如果自动检测结果不准确，您可以手动选择正确的编码进行预览。

支持哪些编码格式的检测？

本工具支持检测以下编码格式： UTF-8（带/不带BOM）、UTF-16 LE/BE、UTF-32 LE/BE、GBK/GB2312（简体中文）、BIG5（繁体中文）、Shift_JIS（日文）、EUC-KR（韩文）、ISO-8859-1（Latin-1）、Windows-1252、ASCII 等20余种编码。对于纯ASCII文本（仅包含英文字母、数字和基本符号），它同时兼容多种编码，工具会优先推荐UTF-8。

检测的准确率有多高？有什么局限性？

对于包含BOM的文件，准确率接近100%。对于不含BOM的中文/日文/韩文文本（超过100字节），准确率通常在90%以上。局限性包括：

极短文本（少于20字节）难以精确判断
纯ASCII文本无法区分具体编码（所有编码都兼容ASCII）
混合编码文件可能导致部分乱码
二进制文件（非文本）无法给出有意义的编码结果

本工具仅分析文件的前1MB内容，对于超大文件也保持快速响应。

如何将检测到的文件转换为UTF-8？

检测完成后，点击预览区域上方的"UTF-8下载"按钮，工具会自动使用检测到的编码（或您手动选择的编码）解码文件内容，然后重新编码为UTF-8格式并提供下载。转换后的文件可以在任何现代文本编辑器、浏览器和编程环境中正常打开，彻底解决乱码问题。下载的文件名为原文件名加上 _utf8 后缀。

HTML实体批量编码 - 完整字符集处理

将整个文本中的非ASCII字符全部转换为HTML数字或命名实体。

开发工具 HTML实体批量编码

自动纠错演示 - 基于字典的拼写修复

输入错误文本，自动寻找最可能正确单词替换，展示编辑距离原理。

教育工具拼写演示自动纠错

热门

HTML实体编码解码工具 - 在线转义工具

在线HTML实体编码与解码工具，实现特殊字符与HTML实体的相互转换，防止XSS及显示问题。

开发工具 HTML 实体编码解码

最新

Unicode 正规化测试器 - NFC/NFD/NFKC/NFKD 对比

输入字符串并选择正规化形式，展示转换结果和码点序列，理解等价字符处理。

开发工具 Unicode 正规化测试

在线文本差异对比工具 - 代码/文档差异比较

在线比较两段文本或代码的差异，高亮显示增删改行，适用于代码审查和版本比对。

开发工具 diff 差异文本对比

热门

像素字体在线设计器 - 按网格绘制字符集

在放大网格上逐点绘制字母与符号，生成像素字体文件（.ttf预览）及CSS代码片段。

字体位图像素字体编辑器设计

ZIP密码尝试检测 - 内置字典和暴力演示

尝试用常见密码字典测试加密ZIP文件，限于教学演示，不保证破解强度。

安全工具 ZIP 安全密码

短信字符计 - 分段提醒与编码检测

显示输入文本长度及等效短信条数，识别可能转Unicode导致分段。

实用工具分段字符短信计数

热门

零宽字符隐写工具 - 隐藏信息到普通文本

利用零宽度空格等不可见Unicode字符将秘密信息嵌入普通文本，肉眼不可见，前端加解密。

加解密文本隐写零宽字符

热门

十六进制转文本工具 - HEX字符串解码

将不带空格的十六进制字符串解码还原为原始文本，方便阅读编码数据。

文本处理十六进制文本解码

最新

正则表达式填字游戏求解器 - 辅助破解 Regex Crossword

针对著名的正则表达式填字游戏，提供辅助输入和验证，理解正则匹配。

开发工具填字正则表达式求解辅助

热门

音高检测器 - 实时分析唱歌或乐器频率

用麦克风实时捕捉声音并显示当前音高及对应的音乐音符和音分偏差。

教育工具检测音高频率

热门

编程字体对比器 - 连字与字符清晰度

并排展示Fira Code、JetBrains Mono等编程字体的连字和标点清晰度效果。

参考工具对比等宽编程字体

热门

网页字体检测器 - 列出当前页面所有字体

扫描当前页面使用的所有字体栈，并展示实际渲染字体名及样例。

开发工具字体检测网页

最新

TODO/FIXME 注释收集器 - 扫描代码中的待办标记

扫描粘贴的代码，高亮并列出所有 TODO、FIXME、HACK 等标记注释，帮助跟踪开发任务。

开发工具 FIXME TODO 扫描注释

最新

文本统计信息在线工具 - 字符/单词/行数/段落计数

实时统计输入文本的字符数（含/不含空格）、单词数、行数、段落数等，适合写作和代码文档检查。

开发工具字数文本统计行数

按键代码查看器 - JavaScript KeyCode在线检测

按下键盘任意键，实时显示对应JavaScript键盘事件的key、keyCode、code等信息，方便开发调试。

开发工具 KeyCode 按键检测

热门

ISO 7064校验码计算 - 身份证/账号校验

使用纯系统数字算法计算字符串的ISO 7064 Mod 97-10等校验位，用于生成账号。

开发工具 ISO 7064 校验码算法

最新

密码哈希在线验证器 - 识别 bcrypt/argon2 等格式

输入一个密码哈希字符串，识别其算法（bcrypt、argon2、SHA-256 等）并验证格式。

安全哈希密码识别验证

拼写纠错建议器 - 编辑距离推荐正确单词

输入可能拼错的英文单词，根据字典和编辑距离返回最可能的正确拼写。

教育工具建议拼写纠错

图片转Unicode方块画 - ░▒▓█字符艺术

将图片转换为使用不同密度的Unicode块元素（░▒▓█）构成的文本艺术。

图像工具 Unicode 图片字符画

在线二维码生成器 - 文本/链接转QR Code

在线二维码生成工具，将文本、网址、联系信息等内容生成QR Code图片，可自定义大小和颜色，前端生成不涉及上传。

图像工具 QR Code 二维码生成器

段落统计器 - 段落数、平均字数等

快速统计文本的段落数、平均每段字数、最长/最短段落等维度。

分析工具写作段落统计

最新

Web 安全头分析器 - 检测缺失的 HTTP 安全标头

输入 URL 或粘贴响应头，评估 CSP、HSTS、X-Frame-Options 等安全头的配置情况并打分。

安全工具 HTTP 安全安全头检测

最新

Markdown 链接有效性检查器 - 提取并验证所有超链接

粘贴 Markdown 文本，提取所有链接并快速测试返回状态码（使用 fetch），标记失效链接。

开发工具 Markdown 有效性检查链接

最新

Unicode 制表符绘制工具 - 构建文本表格与边框

使用鼠标绘制表格或边框，自动将线条转换为 Unicode 制表符，生成纯文本表格。

Unicode Unicode 制表符文本表格绘图

最新

形状检测 API 综合演示 - 人脸/条形码/文本检测

调用 BarcodeDetector、FaceDetector 和 TextDetector，处理摄像头或图片。

多媒体 API 人脸形状检测条形码

密码泄露查询 (k-Anonymity) - 安全本地检测

使用SHA-1+k-Anonymity技术安全地核对密码是否曾在已知泄露数据库中，无需上传原文。

安全工具 k-Anonymity 密码查询泄露

文本左右对齐工具 - 等间距填充英文段落

在英文文本的行内插入空格使其左右两端同时对齐，模拟印刷排版效果。

文本处理对齐排版文本

Markdown链接提取器 - 列出所有超链

粘贴Markdown文本，提取所有 `[text](url)` 格式的链接，并导出为表格。

开发工具 Markdown 提取链接

高级字符编码检测器 - 自动识别文件编码