FP-Growth 频繁模式挖掘演示 - 关联规则学习

教育工具数据科学 FP-Growth 关联数据挖掘频繁项集

FP-Growth 频繁模式挖掘

关联规则学习 · 购物篮分析 · 频繁项集挖掘演示

1 2 3 4 5

参数设置

📦 预设数据集

📝 事务数据 (每行一条事务，逗号分隔)

🎯 最小支持度: 0.40

支持度 = 项集出现次数 / 总事务数

🔗 最小置信度: 0.60

置信度 = Support(X∪Y) / Support(X)

FP树可视化等待挖掘...

#	频繁项集	支持度计数	支持度	大小
请设置参数后点击"执行挖掘"

#	前件 → 后件	支持度	置信度	提升度	相关性
请设置参数后点击"执行挖掘"

频繁项	支持度	条件模式基	条件FP树频繁项	挖掘出的模式
请设置参数后点击"执行挖掘"

常见问题与知识点

什么是FP-Growth算法？

FP-Growth（频繁模式增长）是一种无需候选生成的频繁项集挖掘算法。它通过构建FP树（频繁模式树）来压缩数据库，然后递归地从FP树中挖掘频繁模式，避免了Apriori算法中大量的候选生成和数据库扫描。

FP树是如何构建的？

首先扫描数据库统计各项支持度，筛选频繁项并按支持度降序排列。然后对每条事务，只保留频繁项并按此顺序排列，逐条插入FP树——共享前缀则计数累加，新路径则创建新节点。同时维护项头表链表。

什么是条件模式基？

条件模式基是针对某个频繁项的所有前缀路径集合。例如，对于项"啤酒"，找到FP树中所有"啤酒"节点，收集其到根节点的路径（不含"啤酒"自身），路径计数等于该"啤酒"节点的计数。这些前缀路径构成"啤酒"的条件模式基。

支持度、置信度、提升度是什么？

支持度：项集在总事务中出现的比例。置信度：在X出现的条件下Y也出现的概率。Conf(X→Y) = Support(X∪Y)/Support(X)。提升度：衡量X和Y的关联强度。Lift>1正相关，Lift=1独立，Lift<1负相关。

FP-Growth与Apriori哪个更好？

FP-Growth通常比Apriori快1-2个数量级。Apriori需要反复扫描数据库来生成候选集，而FP-Growth只需2次数据库扫描（统计频繁项+构建FP树），之后完全在内存中的FP树上递归挖掘。对于大型数据集，FP-Growth优势更明显。

实际应用场景有哪些？

购物篮分析（发现商品搭配）、推荐系统（"买了X的人也买了Y"）、医疗诊断（症状与疾病的关联）、网络安全（入侵检测模式）、文本挖掘（词语共现模式）、生物信息学（基因表达模式分析）等。

链接关系图谱生成 - 思维导图式网页

输入网址，抓取该页面上的出入链接并绘制成节点关系草图。

SEO工具关系图可视化链接

活动结构化数据生成器 - 会议/演出信息标记

输入活动名称、日期、地点和票价，生成 Event 结构化数据，用于活动搜索结果。

SEO Event JSON-LD SEO 结构化数据

Protobuf 在线解码器 - 原始字节转可读结构

输入Proto定义和Base64编码的protobuf数据，在线解码为JSON，辅助分析二进制通信内容。

开发工具 Protobuf 二进制序列化解码

CI/CD流水线可视化编辑器 - 阶段与任务设计

拖拽构建阶段与任务，配置触发条件，生成对应的GitLab CI或GitHub Actions YAML代码。

DevOps CI/CD DevOps 可视化流水线

K-Means聚类演示器 - 交互式数据分类

在Canvas上随机撒点，运行K-Means算法，观察中心点迭代移动和簇的形成。

教育工具 K-Means 演示聚类

基数排序动画 - LSD方法逐步可视化

随机生成整数数组，逐步展示按低位优先进行的基数排序过程，辅助算法理解。

教育工具动画可视化基数排序

进程调度可视化 - FCFS/SJF/轮转对比

输入进程列表，同时对比先来先服务、短作业优先和轮转调度算法的甘特图和平均等待时间。

教育工具可视化模拟进程调度

最大团问题图例演示 - 穷举搜索与启发式

在无向图上查找最大团，高亮显示顶点，演示回溯或启发式搜索过程。

图论团图论演示算法

最新

Source Map 可视化分析模拟器 - 查看编译前后代码映射

上传或粘贴 source map 文件，展示原始代码与编译后代码的对应关系，辅助调试。

开发工具 Source Map 可视化调试

最新

REST 与 GraphQL 响应格式对比器 - 结构差异可视化

输入同一数据源的两种 API 响应，并排展示结构差异，理解两种风格的数据组织。

API GraphQL REST 对比

最新

structuredClone 可转移对象演示 - 高性能深拷贝

对比结构化克隆与传统深拷贝，演示 ArrayBuffer 等可转移对象如何提升性能。

JavaScript structuredClone 可转移深拷贝演示

Meta标签生成器 - HTML元数据SEO代码片段

为网页生成常用的meta标签（description, keywords, viewport等），优化搜索引擎收录。

SEO工具 Meta标签 SEO 生成器

URL解析工具 - 在线分析URL组成

分解URL为协议、主机、端口、路径、查询字符串和哈希等各个组成部分，便于理解与调试。

开发工具 URL 分析解析

滚动捕捉沙盒 - CSS Scroll Snap实验

调整滚动容器和子项的对齐方式、停止点，观察CSS Scroll Snap平滑滑动效果。

前端设计 CSS 滚动捕捉演示

最新

Web 字体加载策略演示 - FOIT/FOUT 对比

使用不同 font-display 值加载自定义字体，展示未字体下载时的文字显示行为。

CSS FOIT Web 字体加载

首屏关键CSS提取工具 - 可视化选取折叠之上样式

粘贴HTML和CSS，工具将尝试分析并为你抽取首屏内联样式，辅助性能优化。

优化工具 CSS 性能提取

CSV按列排序处理 - 多字段升降序

上传CSV文件，指定优先排序列和升降序，干净地整理杂乱数据。

数据处理 CSV 排序数据

绘制时机检测 - FP/FCP性能指标展示

通过PerformanceObserver获取首次绘制(FP)和首次内容绘制(FCP)时间。

开发工具 API Paint Timing 性能

CPU 调度算法模拟器 - FCFS/SJF/Round Robin

添加进程（到达时间、运行时间），并行动画演示先来先服务、短作业优先、轮转等调度算法的执行。

教育 CPU调度 Round Robin 模拟算法

Data URL解析查看器 - 预览/下载/解构

粘贴以data:开头的链接，自动判断MIME类型并预览内容，或提供下载按钮。

开发工具 Data URL 解析预览

JSON展平工具 - 嵌套对象转为单层键值

将深度嵌套的JSON对象转化为用点号或括号分隔的单层键值对，便于数据清洗。

开发工具 JSON 展平转换

SEO标题/描述预览工具 - 模拟搜索结果卡片

输入标题与描述，模拟Google搜索结果片段，检查截断与关键词效果。

SEO工具 SEO 描述标题预览

Referrer策略检测 - 请求头分析

显示当前网页的Referrer-Policy设置，并模拟不同策略下的Referer发送情况。

安全工具 Referrer 检测策略

Sass Mixin生成器 - 常用代码块模板

选择常用模式(如响应式断点、flex居中、省略号)，生成对应Sass Mixin代码。

开发工具 Mixin Sass 生成器

请求节流演示器 - 滑块/桶算法可视化

动画展示滑动窗口和令牌桶算法如何限制API请求速率，对比两者差异。

开发工具演示算法节流

社媒链接预览生成器 - Open Graph卡片模拟

输入URL的OG标签内容，模拟在Facebook/Twitter上的链接预览卡片效果，调试SEO标记。

SEO工具 Open Graph 模拟社媒预览

最新

datalist 自动建议测试 - 自定义输入提示列表

创建 input + datalist 组合，动态添加选项并测试过滤行为和兼容性。

HTML datalist 测试输入建议

SQL 格式化器增强版 - 支持BigQuery/Snowflake方言

适配多种SQL方言的关键词大小写与缩进风格，并可添加注释提示，提升大查询可读性。

开发工具 BigQuery SQL 方言格式化

加载动画合集 - 数10种纯CSS Spinner预览

浏览数十种纯CSS加载旋转器，点击复制代码或自定义颜色尺寸，节省开发时间。

UI CSS spinner 代码片段加载动画

HTTP请求时序图生成器 - 瀑布图分析

手动输入多个请求的起止时间，绘制并发请求时序瀑布图，模拟Web性能优化。

开发工具分析时序瀑布图请求