大文本文件分段读取器 - FileReader分块

点击上传或拖拽文件到此处

支持任意文本文件（.txt .csv .log .json .xml .md 等），最大支持 2GB

常见问题与知识点

大文本文件分段读取器是一个基于浏览器 FileReader API 的工具，它利用 Blob.slice() 方法将大文件切分为多个小块，然后使用 FileReader.readAsText() 逐块异步读取。这种方式可以避免一次性将整个大文件加载到内存中，从而防止浏览器崩溃或卡顿。

核心原理：

Blob.slice(start, end)：从文件中切出指定字节范围的数据块。
FileReader.readAsText(blob, encoding)：异步读取该数据块为文本字符串。
通过循环或递归方式逐块读取，每块读取完成后触发回调，更新UI。
读取间隔（setTimeout）确保浏览器有时间响应用户操作，避免主线程被长时间占用。

直接读取整个文件的问题：对于几百MB甚至GB级别的大文件，一次性读取会将整个文件内容加载到内存中，可能导致：

浏览器内存溢出，页面崩溃
UI长时间冻结，用户体验极差
无法显示读取进度
无法中途暂停或取消

分段读取的优势：

内存友好：每次只处理一个小块（如1MB），内存占用可控。
进度可见：用户可以实时看到读取进度。
可暂停/继续：用户可以随时暂停读取操作。
UI响应：块之间有间隔，浏览器可以处理用户交互。
灵活查看：用户可以跳转到任意已读取的块进行查看。

如何选择合适的分块大小？

分块大小的选择取决于多个因素：

小文件（<10MB）：可以直接使用1-2MB的块大小，快速完成读取。
中等文件（10MB-100MB）：建议使用1-5MB的块大小，平衡速度和内存。
大文件（100MB-1GB）：建议使用512KB-2MB的块大小，确保内存安全。
超大文件（>1GB）：建议使用256KB-1MB的块大小，配合读取间隔使用。

经验法则：块越小，内存越安全但读取总时间可能略长；块越大，读取越快但内存压力增大。对于大多数场景，1MB是一个很好的默认选择。

分段读取不会导致乱码，因为 FileReader.readAsText() 会按照指定的编码正确解码每个数据块。但需要注意以下情况：

多字节字符边界：对于UTF-8等多字节编码，一个字符可能被分割到两个块中。不过浏览器底层的TextDecoder会妥善处理这种情况，通常最后一个不完整字符会被替换为替换字符�。
BOM头：UTF-16编码的文件可能有BOM（字节顺序标记），仅出现在文件开头。

支持的编码：UTF-8（推荐）、UTF-16LE、UTF-16BE、ISO-8859-1（Latin-1）。如果您的文件使用GBK/GB2312等编码，建议先用其他工具转换为UTF-8。

浏览器的文件处理能力受以下因素影响：

Blob.slice() 理论上支持最大约 2GB 的文件（受32位索引限制）。
可用内存：虽然分段读取减少了内存压力，但所有已读取的块仍存储在内存中。对于超大文件，建议仅读取需要的部分。
单个块大小：建议不超过100MB，否则单次读取可能造成明显卡顿。
持久存储：浏览器可能对单个页面的内存使用有隐式限制（通常1-4GB）。

本工具理论上可处理最大约2GB的文件，但建议文件不超过500MB以获得最佳体验。

Blob.slice(start, end, contentType) 是Blob对象的方法，用于创建原数据的一个子片段（新Blob对象），而不会复制实际数据。参数说明：

start：起始字节位置（从0开始）。
end：结束字节位置（不包含该位置）。
contentType：可选，新Blob的MIME类型。

在分段读取中，slice() 用于从原始文件中"切出"指定大小的数据块，然后交给FileReader进行读取。由于它不会复制数据，所以操作非常高效，即使对超大文件也是如此。

上传文件获取MIME类型 - 前端检测

选择本地文件，通过浏览器File API获取其MIME类型、大小及最后修改时间。

开发工具 MIME 文件检测

PDF页数统计 - 快速前端获取页数

上传PDF文件，利用pdf.js快速显示文档总页数，无需打开文件。

文件工具 PDF 统计页数

最新

Selection API 浏览器 - 获取选中文本与位置信息

选中页面文字后，显示选区的起止偏移、矩形边界、包含节点等详细信息。

交互 Selection API 分析选中

最新

Canvas 文字适配器 - 测量文本宽度并自动缩放

输入文本和最大宽度，计算在 Canvas 上绘制所需字体大小，生成自适应的 fillText 代码。

Canvas Canvas 文本适配

最新

Webpack Loader 测试器 - 模拟文件转换过程

编写一个简单的 loader 函数，输入文件内容，查看经过 loader 处理后的输出。

开发工具 Loader Webpack 测试转换

网页资源瀑布图展示 - 请求时间线和大小

利用Performance API绘制当前页面所有资源的加载时间线和文件大小瀑布图。

开发工具性能瀑布图资源加载

近距离传感器测试 - 设备接近检测前端API

使用Proximity Sensor API检测设备屏幕附近是否有物体靠近，显示距离与状态。

开发工具传感器检测近距离

USB 温度传感器读取 - WebUSB 数据显示

连接支持 WebUSB 的温度传感器，实时读取并显示温度值，绘制趋势图。

物联网 USB 传感器温度读取

NFC 只读演示 - 扫描并显示 NDEF 记录

使用 Web NFC 读取附近标签的 NDEF 消息，展示每条记录的类型和内容。

演示 NDEF NFC 演示读取

二进制文件十六进制查看器 - 上传文件检查字节

上传任何文件，以十六进制和 ASCII 对照形式显示文件字节内容，适合简单分析文件头。

分析二进制十六进制文件查看器

Web Share API 实战实验室 - 分享内容组合测试

组合标题、文本、URL 和文件，调用系统原生分享界面，测试不同浏览器和操作系统的分享行为。

API演示 API Web Share 分享文件

最新

文件系统访问 API 沙盒 - 读写本地文件

使用 showOpenFilePicker 或 showSaveFilePicker 选择文件并读取/写入内容，体会原生文件交互。

开发工具 File System Access 文件演示

最新

MD5 文件校验 - 上传比对哈希值

计算文件的MD5值，与官方提供的哈希对比验证完整性。

安全工具 MD5 哈希文件校验

最新

局域网速度估测 - 文件传输时间模拟

根据已知带宽或手动输入，估算传输指定大小文件所需时间。

测试估算文件网络速度

短信字符计 - 分段提醒与编码检测

显示输入文本长度及等效短信条数，识别可能转Unicode导致分段。

实用工具分段字符短信计数

媒体录制定时器 - 分段自动切割视频

设置录制时长自动分段保存，适合长时间录屏或监控，避免单个文件过大。

媒体工具分段定时录制

文件传输时间计算器 - 带宽换算

输入文件大小和网络带宽，估算上传或下载所需的时间。

实用工具传输文件计算

文件批量重命名预览器 - 规则模拟

选择多个本地文件，预览应用查找替换、添加前缀后缀等重命名规则的效果。

实用工具批量文件重命名

文件分割合并器 - 大文件切片处理

选择文件，设定切片大小，将文件切成多个Blob下载；也可选择多个切片合并还原。

实用工具分割切片文件

NFC标签读取演示 - Web NFC API模拟

使用Web NFC API读取NDEF格式标签的数据，展示记录类型和内容（需硬件支持）。

检测工具 NFC 标签读取