朴素贝叶斯垃圾邮件过滤器 - 概率分类演示

教育工具机器学习分类垃圾邮件朴素贝叶斯概率

训练样本总数

🛑 垃圾邮件

✅ 正常邮件

📚 词汇表大小

训练数据

添加训练样本

按回车键快速添加

邮件分类测试

输入待分类的邮件文本

输入邮件文本并点击分类，查看朴素贝叶斯的概率推断过程

常见问题与知识点

什么是朴素贝叶斯分类器？

朴素贝叶斯是一种基于贝叶斯定理的概率分类算法。它"朴素"地假设所有特征（词）之间相互独立。尽管这个假设在现实中不成立，但它在文本分类（如垃圾邮件过滤）中表现优异，计算效率极高。

什么是拉普拉斯平滑？

拉普拉斯平滑（Laplace Smoothing）用于解决零概率问题：如果测试文本中的某个词在训练数据中从未出现，朴素贝叶斯会将其概率估计为0，导致整体乘积为0。平滑通过给每个计数加一个小的α值（通常为1），确保没有零概率。

为什么使用对数概率？

当文本较长时，许多小概率相乘会得到极小的数值，可能导致计算机浮点数下溢（变为0）。使用对数将乘法转换为加法：log(P1×P2×...)=log(P1)+log(P2)+...，有效避免下溢问题，同时保持结果的单调性。

朴素贝叶斯在垃圾邮件过滤中的优势？

①训练速度快，适合增量学习；②对小规模数据也能良好工作；③可解释性强——可以清晰看到哪些词推动了分类决策；④对新出现的垃圾邮件变体有一定泛化能力；⑤内存占用小，适合邮件客户端本地运行。

中文垃圾邮件过滤有什么特殊挑战？

中文文本没有天然的空格分隔，需要分词处理。中文垃圾邮件常使用谐音、变体字、拆字等手法规避过滤。本演示使用字符级分词，实际应用中通常结合专业分词器（如jieba）和更多特征工程手段。

如何提高分类准确率？

①增加高质量训练数据；②去除停用词（如"的"、"是"等无区分度的词）；③使用TF-IDF加权代替简单词频；④结合n-gram特征（词组）；⑤考虑邮件头信息（发件人、发送时间等）；⑥使用伯努利或多项式朴素贝叶斯变体。

邮件垃圾评分模拟 - 常见避规规则

分析邮件内容的词语触发规则，估算可能的垃圾邮件评分并给出修改建议。

优化工具垃圾邮件检测评分

热门

音乐风格小试验 - 上传片段判断流派

上传很短的音乐片段，使用简单的音频特征分析预测流派。

实验分类试验音乐风格

热门

假地址生成器 - 测试用国际地址随机

生成包含街道、城市、邮编的合理格式虚假国际地址，用于原型测试。

开发工具地址测试随机

不想要礼物清单 - 避免收到重复或无用礼物

创建你的“请勿送”清单，分享给家人朋友，标注已拥有的物品，减少浪费。

生活工具分享清单礼物避免

热门

JSON 试题生成器 - 自定义题库随机组卷

上传 JSON 格式题库，随机抽取指定数量题目生成在线测验，自动评分和解析。

工具 JSON 生成试题随机

WebAuthn模拟器 - 创建与验证凭据

使用CTAP2模拟器或安全密钥在浏览器中体验无密码注册与认证流程。

安全工具 WebAuthn 安全演示

邮件响应式测试预览 - 多客户端模拟

粘贴 HTML 邮件代码，模拟在 Outlook、Gmail、Apple Mail 等环境下的渲染效果。

测试响应式测试邮件预览

JSON Schema 假数据生成器 - 按定义创建莫克数据

定义JSON Schema结构，自动填充符合类型与格式的随机数据，支持导出大文件用于压力测试。

开发工具 JSON Schema Mock 数据生成

IntersectionObserver 实验台 - 元素可见性触发

设定观察阈值，实时查看目标元素进入/离开视口时的回调，学习交叉观察者API。

API IntersectionObserver 可见性懒加载滚动

SQL注入演示平台 - 模拟漏洞与防护

构建一个虚拟的登录窗，演示SQL注入登录绕过，并展示参数化查询如何防范。

安全工具 SQL注入安全演示

热门

随机配对生成器 - 名单抽取一一组合

粘贴名单，随机生成两两配对组合，适合安排搭档练习或活动结对。

效率工具分组名单配对随机

Scattergories 类别生成器 - 随机抽取开战

随机生成12个类别与一个字母，用于玩快速分类游戏。

派对 Scattergories 派对生成类别

邮件通讯预览 - 不同邮箱客户端模拟

粘贴邮件HTML代码，在类似Gmail、Outlook的模拟框中预览效果。

开发工具客户端邮件预览

热门

浏览器通知测试器 - Web Notification API模拟

测试浏览器通知权限和弹出，自定义标题、正文及图标，发送系统桌面通知，调试推送。

开发工具 Notification 测试通知

Hashcash工作量证明生成 - 反垃圾邮件

为了演示生成一个简单的Hashcash stamp，需要消耗CPU计算，用于反垃圾机制展示。

安全工具 Hashcash 反垃圾生成

JSONPath转CSV提取器 - 批量抽取字段

对复杂JSON应用JSONPath抽取多条记录，并直接导出为CSV表格。

开发工具 CSV JSONPath 提取

骰子表达式展开器 - 模拟掷骰分布

输入如'3d6+2'的表达式，计算所有可能结果和分布图，以及期望值。

概率概率表达式骰子

JSON Merge Patch/JSON Patch 生成器 - 根据差异创建补丁

提供原始与修改后的JSON，自动生成符合RFC6902的JSON Patch或RFC7396 Merge Patch。

JSON JSON JSON Patch 差异补丁

事件监听器查看器 - 获取指定元素绑定事件

选择 DOM 元素，列出通过 addEventListener 绑定的所有事件及其类型和监听器（可用时）。

开发工具 JavaScript 事件监听元素调试

SMTP 命令行模拟器 - 交互邮件发送过程

逐步骤模拟SMTP握手：EHLO、MAIL FROM、RCPT TO、DATA，查看服务器响应。

教育工具 SMTP 命令行模拟邮件

热门

推特推文截图模拟器 - 假推文生成器

编辑用户名、头像、内容、点赞数等，生成逼真的假推文截图，用于演示或搞笑。

娱乐假推文截图推特模拟

前端打包体积在线分析 - 可视化 Bundle 各模块占比

上传或粘贴 webpack 等工具的 stats.json 文件，生成交互式树状图，直观查看各模块大小与占比。

开发工具 Webpack 体积可视化打包分析

单表替换密码破译助手 - 频率分析交互

加载密文，工具显示字母频率，允许手动拖拽映射字母，实时预览解密进展。

加密解密替换密码破译频率分析

反应扩散系统模拟器 - Gray-Scott 模型图案生成

运行 Gray-Scott 反应扩散模型，调节参数生成斑点、条纹等生物斑图。

模拟反应扩散图案图灵模拟

热门

JSON Web Key 生成器 - 在线创建JWK公私钥

生成RSA/EC对称密钥的JWK表示，支持复制导出，用于OAuth2/JWT的密钥配置。

安全 JWK JWT 密钥生成

热门

随机用户信息生成器 - Mock数据在线生成

生成随机的姓名、邮箱、地址、电话等用户信息，支持自定义字段和批量输出JSON数组，用于测试填充。

开发工具假数据生成器随机用户

XSS 过滤器绕过测试场 - 安全编码演示

尝试输入各种编码和混淆的 XSS 向量，检查是否被过滤或执行（沙盒环境）。

安全工具 XSS 测试绕过过滤器

Monorepo 依赖图生成器 - 可视化包间关系

上传或输入 lerna.json / workspace 配置，生成交互式依赖关系图。

开发工具 Monorepo 依赖可视化图

比手划脚词库抽选 - 随机主题卡片

按电影、书籍、动物等分类，随机抽单词供表演猜，支持难度设定。

派对抽选比手划脚派对猜词

热门

Leet语转换器 - 在线1337文本风格生成

将普通英文文本转换为Leet语（如E→3, A→4），多种替换强度可选，给文字增添极客风格。

文本处理 Leet Speak 文本转换