语音识别转文字演示 - Web Speech API

AI 工具 API Web Speech 文字语音识别

✓ 已复制到剪贴板

00:00 就绪

语言

点击下方麦克风按钮开始录音，您的话语将实时显示在这里...

字符数：0 | 单词数：0

识别历史

暂无识别记录

常见问题与知识点

Web Speech API 是浏览器内置的语音识别接口，允许网页直接通过麦克风捕获语音并将其转换为文字。它由 W3C 制定标准，主要包含 SpeechRecognition（语音识别）和 SpeechSynthesis（语音合成）两部分。语音识别过程中，浏览器会将音频数据发送到云端服务器进行处理（如 Google 的语音识别服务），因此需要稳定的网络连接。识别结果可以是实时的（interim results）或最终的（final results），支持多种语言。

目前 Google Chrome（桌面版和 Android 版）和 Microsoft Edge（基于 Chromium）对 SpeechRecognition API 支持最为完善。Firefox 在 about:config 中开启相关标志后可部分支持。Safari（包括 iOS Safari）的支持较为有限，在 iOS 14+ 上有实验性支持但稳定性不佳。Opera 等 Chromium 内核浏览器通常也支持。使用前建议使用最新版 Chrome 或 Edge 以获得最佳体验。本工具会自动检测浏览器兼容性并给出提示。

是的，Web Speech API 的语音识别通常需要网络连接，因为音频数据会被发送到浏览器厂商的云端服务器进行识别处理（Chrome 使用 Google 的语音识别服务）。Chrome 在某些平台上也支持离线语音识别（需提前下载语言包），但这取决于浏览器设置。关于数据安全：语音数据在传输过程中经过加密，Google 等厂商声明会遵守隐私政策处理数据。如果您处理敏感内容，建议了解相关服务商的隐私条款，或考虑使用本地部署的语音识别方案。

使用外接麦克风：相比内置麦克风，外接麦克风通常能提供更清晰的音频输入。
减少环境噪音：在安静的环境中使用，避免背景音乐、风扇噪音等干扰。
发音清晰：以自然的语速和清晰的发音说话，避免含糊不清。
选择正确的语言：确保语言设置与您说话的语言匹配，混合语言会降低准确率。
靠近麦克风：保持适当距离（约15-30厘米），避免过远或过近。
使用短句：较长句子在实时识别中可能被截断，适当停顿有助于提高准确性。

本工具支持 16种常用语言，包括中文普通话、粤语、英语（美式/英式）、日语、韩语、法语、德语、西班牙语、葡萄牙语、意大利语、俄语、阿拉伯语、印地语、泰语和越南语等。Web Speech API 实际支持超过 50 种语言。需要注意的是，API 不支持混合语言识别——您需要预先选择一种主要语言，系统会按该语言进行识别。如果一段话中夹杂其他语言词汇，识别准确率会受到影响。

常见原因包括：

浏览器不支持：请使用最新版 Chrome 或 Edge。
非 HTTPS 环境：语音识别 API 通常要求在 HTTPS 或 localhost 下运行（安全限制）。
麦克风权限被拒绝：请在浏览器设置中允许该网站访问麦克风。
没有麦克风设备：检查设备是否连接了麦克风。
操作系统限制：部分操作系统（如 iOS）对 Web Speech API 的支持有限。
网络连接问题：语音识别需要网络，请检查网络连接。

Web Speech API 提供两种识别结果：Interim Results（临时结果）是识别过程中的实时反馈，会随着更多语音输入不断更新和修正，在显示区域以灰色斜体显示；Final Results（最终结果）是经过确认的稳定文本，不会再发生变化，以正常黑色字体显示。当您停止说话后，临时结果会被确认为最终结果。这种机制让您能实时看到识别进度，同时确保最终文本的准确性。

当然可以！本工具提供了多种方式保存识别结果：一键复制将全部文本复制到剪贴板；下载为 .txt 文件保存到本地设备；历史记录面板自动保存每次识别的文本（当前会话期间），方便您回溯和对比。每条历史记录都可以单独复制或加载到主显示区。需要注意的是，历史记录仅在当前浏览器会话中保留，刷新页面后会清空。

Web Speech API 综合演示 - 识别与合成双向

在页面中同时使用语音识别和合成，展示如何构建语音交互界面。

热门

语言检测模拟器 - 基于Unicode范围猜测文本语言

通过分析字符的Unicode区块，推算文本最可能属于哪种语言/文字系统，无需网络即用。

教育工具 Unicode 检测语言

WebTransport API 演示 - 基于 QUIC 的数据报发送

模拟创建 WebTransport 连接（需服务端配合），发送和接收数据报，体验低延迟通信。

开发工具 QUIC WebTransport 演示

Feature Policy查询器 - 功能权限检测

检测当前页面可用的浏览器功能策略（如相机、麦克风），并生成对应的Permissions-Policy头。

安全工具 Feature Policy 权限检测

JSON-LD结构化数据验证 - Schema语法检查

检查输入的JSON-LD代码是否符合JSON语法及常见Schema.org类型规范，高亮错误。

SEO工具 JSON-LD Schema 验证

游戏手柄测试器 - Gamepad API在线检测按键

连接游戏手柄，实时显示摇杆、方向键、按钮的按下状态和力度，调试游戏输入。

开发工具 Gamepad 测试游戏手柄

PostCSS 插件演练场 - 在线测试 CSS 转换

输入 CSS 和自定义 PostCSS 插件代码，实时查看处理后的输出，用于插件开发。

开发工具 CSS PostCSS 插件测试

HTML标题层级检查器 - h1-h6语义分析

输入HTML或直接编写标题结构，检查h标签的层级是否跳跃，确保页面轮廓正确。

SEO工具层级标题语义

结构化数据测试工具 - 实时预览Google搜索结果

粘贴HTML或JSON-LD，工具检测并模拟Google搜索结果中的富文本摘要预览。

SEO工具 SEO 测试结构化数据

CSS 嵌套语法测试器 - 原生嵌套规则实时转译

编写即将到来的CSS原生嵌套语法，实时查看等效的传统CSS输出与匹配效果。

CSS CSS嵌套测试语法转译

CSS选择器测试器 - 验证表达式是否匹配

提供HTML片段和CSS选择器，高亮匹配的元素并返回数量，快速验证选择器效果。

前端设计 CSS选择器测试验证

JSON对比工具 - 在线查找JSON对象差异

比较两个JSON对象的深层差异，高亮新增、删除和修改的键值，辅助数据同步与调试。

开发工具 JSON 对比差异

关键词密度分析器 - 改进版含单字/双词组合

计算文章关键词及 N-gram 短语的密度，辅以 TF 可视化，帮助内容优化。

SEO工具 SEO 关键词密度分析词频

关键词缺口分析器 - 比较你与竞对页面词频

输入自己与竞争对手页面内容，提取高频词并显示重叠与差异，发现内容机会。

SEO工具 SEO 关键词对比缺口

数据库关系图绘制器 - 从 SQL DDL 生成 ER 图

粘贴 SQL DDL 建表语句，自动提取表结构和外键关系并绘制实体关系图。

工具 DDL ER图关系图数据库

热门

批量条形码生成器 - 多数据同时生成Code128

粘贴多行数据，一次性生成对应多个条形码图片，可设置尺寸，适合打印标签批量。

图像工具批量条形码生成

SEO词频分析器 - 与竞争对手对比

粘贴自己和竞品文章，分析关键词密度和重叠度，辅助内容优化。

SEO工具 SEO 关键词分析

简易内存泄漏检测 - 快照对比

对页面进行两次堆快照(需手动操作)，简单对比新增对象数量和大小。

开发工具内存泄漏检测调试

指针锁定 API 演示 - 3D 迷宫移动

使用指针锁定 API 在 3D 场景中控制视角移动，模拟 FPS 游戏鼠标控制。

API演示 API Pointer Lock 演示迷宫

文字情绪板生成器 - 关键词配色与排版

输入代表情绪的关键词，自动匹配配色方案和字体样式，生成情绪板卡片。

创意情绪板排版文字配色

热门

CSS 3D 立体文字生成器 - 多层阴影叠加

通过多层 text-shadow 叠加生成具有厚度和光照感的 3D 文字效果。

CSS 3D CSS 文字立体

基于模式的模拟数据生成器 - 自定义字段与规则

定义字段名称和类型（姓名、邮箱、数字范围等），批量生成符合规则的 JSON 模拟数据。

开发工具 API 模拟数据测试生成

Storage Buckets API 实验室 - 分区存储策略

创建多个存储桶，分别设置持久化与配额策略，管理不同业务数据的存储优先级与驱逐顺序。

存储 API IndexedDB Storage Buckets 存储

多屏幕窗口放置演示 - 扩展桌面布局

检测并列举所有显示器，将网页窗口精确定位到指定屏幕的特定位置，适合多屏办公场景。

API演示 API Window Placement 多屏幕窗口

内容索引 API 查看器 - 管理离线可用内容列表

添加、列出和删除内容索引中的条目，展示离线可用内容。

PWA API PWA 内容索引离线

文本高亮效果生成器 - 荧光笔/下划线动画

制作像荧光笔划过的高亮背景或扫描下划线效果，导出类名。

CSS CSS 下划线文字高亮

热门

字谜画谜生成器 - 文本符号拼凑

将单词或短句用相似读音的数字/符号替换，创造趣味字谜，可导出图片分享。

创作字谜文字生成画谜

热门

语音实时转文字板 - 标点自动添加与编辑

使用Web Speech Recognition API将语音转为文本，支持自动标点，可事后编辑复制。

效率工具实时文字语音识别转录

Web Share API 实践器 - 调用系统分享对话框

触发系统原生分享，支持分享文本、链接与文件，检查浏览器兼容性与支持级别。

API API Web Share 分享系统

View Transition API 演练场 - 页面切换动画配置

在单页内模拟MPA过渡效果，自定义进场/出场动画，体验View Transitions API丝滑切换。

动画 API View Transition 动画过渡