数据分类演示器 - 手写数字k-NN模拟

AI演示教育工具分类机器学习演示

手写数字 k-NN 分类演示器

在画布上绘制数字，体验 k-最近邻算法 如何识别手写数字

交互式演示

绘制数字

快速加载预设数字：

画笔粗细： 18px

算法参数

k 值（邻居数）

距离度量

欧几里得曼哈顿

分类结果

在左侧画布绘制数字，然后点击 "识别数字"

或点击预设数字按钮快速体验

训练数据集预览 30个样本

常见问题 & 知识点

什么是 k-NN（k-最近邻）算法？

k-NN（k-Nearest Neighbors） 是一种简单而强大的监督学习算法，用于分类和回归。它的核心思想非常直观：

特征空间：每个样本都是多维空间中的一个点（本工具中，每个数字被降采样为8×8=64维向量）。
距离计算：计算未知样本与所有训练样本之间的距离。
投票决策：找出距离最近的 k 个邻居，由它们投票决定分类结果。

📌 k-NN 属于"惰性学习"算法，它不进行显式训练，而是在预测时才计算距离。

k 值如何选择？有什么影响？

k 值 是 k-NN 中最重要的超参数：

k 太小（如 k=1）：模型对噪声敏感，容易过拟合，单个异常点就能改变结果。
k 太大（如 k=15）：决策边界过于平滑，可能忽略局部特征，导致欠拟合。
经验法则：通常取 k = √N（N 为训练样本总数），或通过交叉验证选择。本工具默认 k=3，适合30个样本的数据集。

💡 在本工具中，你可以拖动滑块调整 k 值，观察不同 k 值对分类结果的影响。

欧几里得距离 vs 曼哈顿距离，有什么区别？

两种距离度量方式在计算"远近"时有本质不同：

欧几里得距离：直线距离（"乌鸦飞行"），√(Σ(xᵢ-yᵢ)²)。对较大差异更敏感（平方放大）。
曼哈顿距离：坐标轴方向距离之和（"城市街区"），Σ|xᵢ-yᵢ|。对异常值更鲁棒。

🔍 在手写数字识别中，两种度量通常给出相似结果，但欧几里得距离更常用。

为什么需要降采样到 8×8 网格？

降采样（从280×280像素到8×8网格）有多个目的：

降维：原始280×280=78,400维太高，计算距离极慢且容易受像素级噪声影响。
特征提取：8×8=64维保留了数字的宏观形状特征，忽略细微抖动。
泛化能力：粗粒度的特征使得不同书写风格的数字更容易匹配。

📐 这类似于 MNIST 数据集使用 28×28 像素，但在本演示中 8×8 足以区分 0-9。

k-NN 算法有哪些优缺点？

优点：简单直观、无需训练过程、适用于多分类问题、可处理非线性边界。

缺点：

计算成本高（每次预测需遍历全部训练数据）。
对特征缩放敏感（需归一化）。
受维度灾难影响（高维空间距离区分度下降）。
需要合理选择 k 值和距离度量。

⚡ 对于小规模数据集（如本工具30个样本），k-NN 是非常实用的选择。

置信度是如何计算的？

置信度 = 获胜类别的票数 ÷ k值 × 100%。

例如：k=5，最近邻中3个是数字"3"，2个是数字"8"，则预测为"3"，置信度 = 3/5 = 60%。

📊 置信度越高说明预测越可靠。如果多个类别票数接近，说明输入数字可能位于类别边界。

连续语音识别器 - Web Speech API 实时转写

使用 Web Speech Recognition API 持续捕捉语音，实时显示识别文字，支持多语言。

AI API 实时语音识别转写

热门

盲打键位训练器 - 显示字母高亮按键

屏幕随机显示字母，需要在键盘上按下对应按键，界面高亮提示指法位置。

效率工具盲打练习键盘

热门

术语表生成器 - 圈出专有名词并生成清单

粘贴技术文档，提取所有首字母大写的短语并生成带定义的简易术语表。

写作工具提取文档术语表

最新

轮询机制模拟器 - setInterval 数据请求演示

模拟客户端定时请求服务器数据，展示网络延迟和响应，对比短轮询效率。

开发工具实时模拟演示轮询

调号闪卡训练器 - 升降号数量识别

显示含有不同升降号数目的调号，快速点击对应的大调和小调名称。

教育工具训练调号闪卡

虚拟算盘教学 - 有步骤示范加减

带语音和动画的算盘，逐步演示如何拨珠进行加减运算。

教育工具教学珠算算盘

文本字段提取转 CSV - 使用正则表达式捕获

定义正则表达式，从非结构化文本中提取字段并自动生成 CSV 表格。

数据 CSV 提取文本正则

热门

语音实时转文字板 - 标点自动添加与编辑

使用Web Speech Recognition API将语音转为文本，支持自动标点，可事后编辑复制。

效率工具实时文字语音识别转录

最新

远程触控手势模拟器 - 在移动端模拟鼠标事件

在手机触摸屏上操作，生成对应的鼠标事件日志，用于测试网页的触控兼容性。

开发工具手势模拟触控远程

热门

桑基图生成器 - 流量/能量分流图

通过CSV或手动输入源、目标、数值，生成展示流向和占比的桑基图。

数据可视化可视化图表桑基图

热门

MIDI转CSV转换器 - 提取音符数据

上传.mid文件，将里面的音符事件(时间、音高、力度)提取为CSV表格。

转换工具 CSV MIDI 转换

热门

字体子集化工具 - 按需提取字符

上传字体文件(或使用系统字体)，输入需要保留的字符集，生成只含这些字的精简字体。

优化工具优化子集字体

ID3 决策树学习演示 - 信息增益构建树

从表格数据构建决策树，逐步展示信息增益计算与分支选择，可导出树结构图。

教育工具 ID3 信息增益决策树分类

器乐练习日记 - 记录练习时长与曲目

记录每日练习乐器时间、曲目及难点，统计累计时长与进度。

记录器乐日记练习记录

虚拟钢琴和弦学习卡 - 显示指位自动弹奏

显示一个和弦名称，在虚拟键盘上高亮正确琴键并播放，用于学习和弦构成。

学习和弦学习指法钢琴

Mermaid图表在线编辑 - 文本转流程图

编写Mermaid语法，实时预览流程图、时序图、甘特图，并可导出SVG。

可视化 Mermaid 图表编辑器

最新

Markdown 语音朗读器 - 使用 SpeechSynthesis 朗读文档

输入 Markdown 文本，过滤符号后调用语音合成 API 朗读内容，可调节语速和音调。

多媒体 Markdown 朗读语音合成

最新

音频文件元数据查看器 - 读取 ID3 标签与编码信息

上传 MP3/AAC/OGG 等音频文件，显示标题、艺术家、专辑、时长、比特率等标签信息。

多媒体 ID3 元数据查看音频

最新

CI/CD 流水线配置验证器 - 检查 GitHub Actions 语法

粘贴 YAML 配置文件，验证 GitHub Actions、GitLab CI 或 Jenkinsfile 的基本语法。

DevOps CI/CD 流水线配置验证

特殊字符实体速查 - 搜索并复制编码

浏览所有HTML实体符号，点击复制&code;或数字编码。

参考 HTML 字符实体速查

视口单位计算器 - vw/vh/vmin/vmax实时转换

输入设计稿尺寸与视口宽度，计算出对应的vw、vh值，加速移动端适配开发。

前端设计 vw 视口计算

热门

绿幕视频处理 - 替换视频背景为图片

上传绿幕视频和新背景图，实时抠像合成预览并可选录制成WebM。

图像工具抠像绿幕视频

手指关键点追踪 - MediaPipe手势检测

利用MediaPipe Hands模型，实时识别手部21个关键点并在摄像头上绘制骨架。

AI演示 AI 手势识别追踪

歌词音节计数 - 按句子分解

输入歌词，自动计算每句的音节数，辅助填词和节奏编排。

创作工具创作歌词音节

热门

在线算盘 - 拖动算珠学习算术

模拟中国算盘，拖动算珠表示数字，辅助理解十进制和珠算。

教育工具演示算术算盘

肖氏字母转换器 - 英语拼写改革方案

将英文转换为肖伯纳提倡的肖氏字母（Shavian alphabet），体验完全音位化的书写系统。

教育工具拼写肖氏字母转换

最新

语音备忘录转文字 - 录音并自动生成文本

录制语音备忘录，并调用 Web Speech API 将语音实时转换为可编辑的文字笔记。

工具录音语音转录转文字

最新

颜色主题切换演示 - 明/暗模式独立样式测试

编写分别用于 light 和 dark 的 CSS，通过模拟 prefers-color-scheme 立即预览两种主题。

CSS 暗模式测试颜色主题

音频变速不变调播放器 - 练习或快速听书

加载音频，加速或减速播放且保持原音调，适合语言学习。

学习不变调变速学习音频

屏幕时间自省器 - 手动记录各平台耗时

手动或借助浏览器扩展统计在各网站的耗时，设定红线上瘾提醒。

健康工具屏幕时间数字健康监测记录