手指关键点追踪 - MediaPipe手势检测

AI演示图像工具 AI 手势识别追踪

正在加载 MediaPipe 模型... 初始化中

FPS: --

检测信息

等待检测...

检测到手数

置信度

启动检测后此处显示手部信息

关键点坐标 0/21

#	名称	X	Y	Z
等待数据...

常见问题与知识点

什么是 MediaPipe Hands？

MediaPipe Hands 是 Google 开发的高精度手部关键点检测解决方案。它使用机器学习模型从单帧图像中实时检测手部的 21个3D关键点，包括指尖、关节和手腕位置。该技术在浏览器端运行，无需服务器，所有数据处理均在本地完成，保障用户隐私。

21个手部关键点分别代表什么？

21个关键点分布如下：

0 - 手腕：手掌根部中心点
1-4 - 拇指：CMC关节(1) → MCP关节(2) → IP关节(3) → 指尖(4)
5-8 - 食指：MCP关节(5) → PIP关节(6) → DIP关节(7) → 指尖(8)
9-12 - 中指：MCP关节(9) → PIP关节(10) → DIP关节(11) → 指尖(12)
13-16 - 无名指：MCP关节(13) → PIP关节(14) → DIP关节(15) → 指尖(16)
17-20 - 小指：MCP关节(17) → PIP关节(18) → DIP关节(19) → 指尖(20)

每个关键点包含 x, y, z 三个坐标值，分别表示水平位置、垂直位置和深度信息。

手势识别是如何实现的？

手势识别基于关键点之间的几何关系：

手指伸直判断：比较指尖与对应关节的y坐标差值和距离
拇指特殊处理：拇指运动方向与其他手指不同，通过比较拇指尖到食指MCP的距离来判断
组合判断：根据各手指的伸直/弯曲状态组合识别特定手势（如张开手掌=5指伸直，拳头=5指弯曲）

支持识别的手势包括：张开手掌、握拳、胜利手势✌️、大拇指向上👍、食指指向☝️、OK手势、摇滚手势🤘等。

为什么检测不到手或检测不稳定？

检测效果受以下因素影响：

光照条件：光线充足、均匀的环境效果最佳
背景复杂度：简洁背景有助于提高检测精度
手部距离：手部应占据画面适当比例，不要过远或过近
运动速度：快速移动可能导致跟踪丢失
遮挡：手指交叉或部分遮挡会降低检测质量

可尝试调整摄像头角度、改善光照或降低运动速度来优化检测效果。

数据处理和隐私安全如何保障？

本工具的突出优势是完全本地处理：

摄像头画面仅用于浏览器端的实时分析
所有 AI 推理在本地 WebAssembly 环境中运行
不会上传任何图像或视频到远程服务器
无需联网即可进行检测（模型加载后）

这使得本工具非常适合处理敏感场景，如手势控制、医疗康复监测等。

支持哪些浏览器和设备？

需要支持 WebAssembly 和 WebRTC 的现代浏览器：

✅ Chrome 87+ / Edge 87+
✅ Firefox 89+
✅ Safari 15.4+ (macOS / iOS)
✅ Opera 73+
⚠️ 需要 HTTPS 或 localhost 才能访问摄像头
⚠️ 移动端浏览器（Chrome Mobile、Safari）均支持

声明式链接捕获演示 - 一键打开PWA

设置capture_links清单字段，让浏览器在点击链接时自动打开PWA而不是新标签页。

PWA PWA 演示链接捕获

最新

远程触控手势模拟器 - 在移动端模拟鼠标事件

在手机触摸屏上操作，生成对应的鼠标事件日志，用于测试网页的触控兼容性。

开发工具手势模拟触控远程

连续语音识别器 - Web Speech API 实时转写

使用 Web Speech Recognition API 持续捕捉语音，实时显示识别文字，支持多语言。

AI API 实时语音识别转写

数据分类演示器 - 手写数字k-NN模拟

在Canvas上手写数字，通过预训练的简单模型或k-NN演示实时预测数字标签。

AI演示分类机器学习演示

虚拟键盘API演示 - 控制键盘遮盖与布局

体验VirtualKeyboard API如何控制网页不被系统软键盘遮盖，并获取键盘几何信息。

前端设计 API 虚拟键盘遮盖

相对音高训练 - 听根音辩音程

播放一个基准音，再播放第二个音，判断它相对于基准音的音程度数。

教育工具相对音高训练音程

文本字段提取转 CSV - 使用正则表达式捕获

定义正则表达式，从非结构化文本中提取字段并自动生成 CSV 表格。

数据 CSV 提取文本正则

热门

语音实时转文字板 - 标点自动添加与编辑

使用Web Speech Recognition API将语音转为文本，支持自动标点，可事后编辑复制。

效率工具实时文字语音识别转录

最新

轮询机制模拟器 - setInterval 数据请求演示

模拟客户端定时请求服务器数据，展示网络延迟和响应，对比短轮询效率。

开发工具实时模拟演示轮询

最新

音频文件元数据查看器 - 读取 ID3 标签与编码信息

上传 MP3/AAC/OGG 等音频文件，显示标题、艺术家、专辑、时长、比特率等标签信息。

多媒体 ID3 元数据查看音频

热门

和弦识别器 - 输入多个音符反查和弦名

在虚拟键盘上点选几个音符，自动识别可能的和弦名称。

查询和弦查询识别音符

最新

CI/CD 流水线配置验证器 - 检查 GitHub Actions 语法

粘贴 YAML 配置文件，验证 GitHub Actions、GitLab CI 或 Jenkinsfile 的基本语法。

DevOps CI/CD 流水线配置验证

虚拟深呼吸教练 - 4-7-8呼吸法引导

用放大的缩放圆环引导你吸气4秒、屏住7秒、吐气8秒，帮助平复情绪。

健康工具引导放松深呼吸

热门

手动BPM计数器 - 点击测速音乐节奏

随着音乐节奏反复点击按钮，自动计算每分钟节拍数(BPM)，为DJ和跑者便利。

实用工具 BPM 点击节拍

调号闪卡训练器 - 升降号数量识别

显示含有不同升降号数目的调号，快速点击对应的大调和小调名称。

教育工具训练调号闪卡

ID3 决策树学习演示 - 信息增益构建树

从表格数据构建决策树，逐步展示信息增益计算与分支选择，可导出树结构图。

教育工具 ID3 信息增益决策树分类

最新

颜色主题切换演示 - 明/暗模式独立样式测试

编写分别用于 light 和 dark 的 CSS，通过模拟 prefers-color-scheme 立即预览两种主题。

CSS 暗模式测试颜色主题

合成器ADSR包络可视化 - 起音/衰减/延留/释音

拖拽调节ADSR四个阶段参数，直观观察波形包络形状并触发演示音色。

教育工具 ADSR 包络合成器

温度记录仪 - 手动输入生成图表

手动记录不同时间点的温度读数，自动生成时间-温度折线图。

数据可视化图表温度记录

图片EXIF详细查看器 - 挖掘拍摄参数与GPS

上传照片，读取并展示完整EXIF元数据，警示泄露位置风险。

安全工具 EXIF GPS 查看隐私

热门

盲打键位训练器 - 显示字母高亮按键

屏幕随机显示字母，需要在键盘上按下对应按键，界面高亮提示指法位置。

效率工具盲打练习键盘

特殊字符实体速查 - 搜索并复制编码

浏览所有HTML实体符号，点击复制&code;或数字编码。

参考 HTML 字符实体速查

热门

维吉尼亚密码工具 - 多表置换在线加解密

利用关键词进行维吉尼亚密码加密与解密，多表替换增加安全性，古典密码进阶学习。

加解密加密密码维吉尼亚

声音控制渐变背景 - 音量变化改变颜色

用麦克风音量控制网页背景渐变的动态变化，适合音乐可视化与PPT互动。

动画工具声音控制渐变

IndexedDB 数据查询浏览器 - 对象仓库可视化

连接当前页面的IndexedDB数据库，浏览对象仓库与索引，运行简单的过滤与查询。

存储 IndexedDB 存储查询浏览器

热门

念珠/念咒计数器 - 点击或触摸计数108

屏幕显示一串108颗念珠，点击拨动计数，完成一圈提示。

健康工具 108 冥想念珠计数

身体扫描冥想引导 - 语音顺序放松各部位

从脚到头逐步语音提示关注并放松身体各部位，计时完成全身扫描。

健康工具冥想放松语音身体扫描

减淡加深工具 - 局部提亮变暗

用画笔在图片上涂抹进行减淡（提亮）或加深（变暗），模拟传统暗房技术。

图像工具修图减淡加深

剪贴板事件监控器 - 记录复制粘贴操作

监听copy/cut/paste事件，显示传输的数据类型与内容片段，洞察页面剪贴板交互。

安全事件剪贴板监控记录

环境光感应主题切换演示 - 亮度级别自适应暗色

读取设备的AmbientLightSensor数值，超过阈值自动切暗色主题，保护夜间视力。

传感器 AmbientLight 主题环境光自适应