A/B 测试显著性计算器 - Z 检验与 P 值

分析统计 A/B测试显著性统计转化率

A/B 测试显著性计算器

使用 Z 检验计算 P 值，判断实验组与对照组的转化率差异是否具有统计显著性。支持双尾/单尾检验，可视化置信区间。

置信水平

检验类型

快速填充示例：

对照组 A 原始版本

访客数

转化数

实验组 B 新版本

访客数

转化数

常见问题与知识点

统计显著性用于判断实验组与对照组之间的差异是否由随机波动引起。通常当 P 值 < 0.05（置信水平 95%）时，我们认为差异具有统计显著性，即有充分证据表明实验组确实产生了不同于对照组的效果，而非偶然因素所致。

Z 检验是一种基于标准正态分布的假设检验方法。它适用于大样本（通常每组 n > 30，且转化数至少 5 个）的比例比较场景。Z 检验通过计算两组转化率差异相对于标准误的倍数（Z 统计量），来判断差异是否显著。在 A/B 测试中，当样本量足够大时，Z 检验是最常用的方法。如果样本量较小，建议使用 Fisher 精确检验或卡方检验。

不完全是。P 值 < 0.05 表示差异具有统计显著性，但还需要考虑实际显著性（效应量大小）。一个微小的提升（如 0.1%）可能在超大样本下变得"统计显著"，但商业价值有限。此外，还需警惕多重比较问题（同时测试多个变体时，显著性阈值需要调整，如 Bonferroni 校正）以及样本比率偏差（SRM）。建议结合置信区间和提升幅度综合判断。

双尾检验（默认推荐）：检验实验组与对照组是否存在任何方向的差异（更好或更差）。适用于不确定实验效果方向的情况。
单尾检验：仅检验实验组是否优于对照组（或仅检验是否更差）。需要预先假设方向，且更容易获得显著性。在 A/B 测试中，通常推荐双尾检验，因为它更保守、更可靠。单尾检验需要强有力的先验假设支持。

样本量越大，统计功效越高，检测到真实差异的能力越强。小样本可能导致假阴性（实际有差异但未能检测出来）。但过大的样本也可能导致微小、无实际意义的差异变得"统计显著"。建议在实验开始前使用样本量计算器估算所需最小样本量，考虑因素包括：基线转化率、最小可检测效应（MDE）、置信水平和统计功效（通常 80%）。

95% 置信区间表示：如果我们重复实验无数次，其中约 95% 的置信区间会包含真实的差异值。如果置信区间不包含 0（即上下限同号），则说明差异在对应置信水平下显著。置信区间比单一的 P 值提供了更丰富的信息——它不仅告诉我们是否显著，还展示了效应量的可能范围。

测试时长取决于多个因素：样本量需求（流量大小）、基线转化率、预期效应量。一般建议至少运行1-2 个完整业务周期（通常 1-4 周），以覆盖周中/周末、日间/夜间等周期性波动。避免过早终止测试（"偷看"问题），也不要在达到所需样本量后无限制延长。建议使用此计算器结合样本量规划来确定合理的测试时长。

A/B测试显著计算检验 - 转化率对比

输入两组样本的访问量和转化数，计算P值并判断统计学显著性。

统计工具 A/B测试显著性统计

CSS缓动函数生成器 - Cubic-Bezier曲线编辑

直观拖拽曲线控制点，生成CSS transition/animation的cubic-bezier()值，并即时播放动画效果预览。

前端设计 CSS Cubic-Bezier 缓动

最新

表单标签关联验证器 - 检查 label 与 input 的配对

分析表单 HTML，检查是否每个 input 都有正确关联的 label，并指出使用 aria-label 的替代情况。

HTML 关联标签表单验证

最新

XSS 过滤器测试沙盒 - 输入转义与过滤演示

输入可能的攻击向量，选择不同的转义或过滤策略，实时查看是否被安全处理，教育安全开发。

安全工具 XSS 安全演示过滤

ResizeObserver演示 - 响应元素尺寸变化

拖拽改变一个div的大小，通过ResizeObserver API实时显示其新的宽度和高度。

前端设计 ResizeObserver 演示监听

z-index层级可视化 - 拖拽相互遮挡关系

添加多个色块拖拽顺序，直观表现层叠上下文与z-index值。

开发工具 CSS z-index 可视化层级

最新

滚动深度追踪器 - 测量用户阅读百分比

记录用户在页面上的最大滚动深度（25%、50%、75%、100%），并生成可视化热图。

分析分析深度滚动追踪

波的干涉图样生成器 - 双源波长颜色调节

调节两列波的频率、波长和位置，实时观看水面波干涉形成的明暗条纹图案。

教育工具模拟波干涉物理

代码行数统计工具 - 忽略注释空行

粘贴代码，计算总行数、有效代码行数、注释行数和空行数。

分析工具代码行数分析统计

最新

代码语言检测工具 - 根据语法特征推断编程语言

粘贴代码片段，基于关键字和语法模式自动推断编程语言，适合未命名文件的快速识别。

分析代码分析识别语言检测

CIELAB颜色转换 - LAB与RGB/HEX互转

在线将LAB色彩空间值与RGB/HEX进行转换，辅助印刷和设计校色。

前端设计 LAB 转换颜色

结构化数据代码快速检查 - 验证 JSON-LD 语法与必填属性

粘贴 JSON-LD 代码，校验语法并提示常见类型的必填属性缺失，辅助 SEO 调试。

SEO JSON-LD SEO 结构化数据验证

基础风格迁移演示 - 载入预训练小型模型

利用预训练的轻量变换网络在浏览器中简单演示将图片转换成特定风格。

AI演示 AI 滤镜风格迁移

采样定理演示 - 欠采样与混叠现象

调节采样频率，观察对正弦波的离散采样和重建效果，演示欠采样导致的频率混叠。

信号处理混叠演示采样定理

被动事件监听检测 - 滚动性能检查

检测页面touchstart和wheel事件是否使用passive:true，避免移动端滚动延迟。

开发工具 passive 性能滚动

涂黑诗生成器 - 从报纸文章中选字

粘贴一段文本，涂黑不用单词，保留部分文字组成一首再生诗词。

创作工具创意文本涂黑诗

颜色名称查找工具 - HEX与命名颜色互转

输入颜色值查找对应的CSS颜色名称，或浏览所有命名颜色及其色值，提升设计效率。

前端设计 CSS 查找颜色名

戒指尺寸测量器 - 屏幕虚拟量圈

将已有戒指放在屏幕上对照圆圈，或测量手指周长以确定戒指码数。

测量工具尺寸戒指测量

渐变指针取色器 - 从渐变条上精确取中间色

设置渐变两端颜色，鼠标滑过渐变条显示任意位置的精确十六进制色。

前端设计取色渐变设计

点击劫持测试页面 - 检测 X-Frame-Options 缺失

尝试将目标 URL 加载到 iframe 中，检测是否缺少点击劫持防护头，并展示风险。

安全 iframe 安全测试点击劫持

S-Record/HEX转二进制 - 固件文件查看器

解析Motorola S-Record或Intel HEX格式的固件文件，提取显示原始数据块。

开发工具 S-Record 固件解析

最新

Handlebars 模板在线测试 - 输入数据和模板渲染

编写 Handlebars 模板并提供 JSON 数据，即时渲染结果，支持 helpers 自定义，纯前端执行。

开发工具 Handlebars 模板测试渲染

Webmention发送测试 - 手动Ping引用

输入源页和引用页URL，构造Webmention请求通知被引用页面，演示独立博客协议。

开发工具 Webmention 协议发送

最新

CSS 容器查询演示 - @container 根据父元素响应

设置容器宽度阈值，改变容器大小观察组件内部样式的变化，学习容器查询用法。

CSS CSS 容器查询演示

最新

Web 字体优化建议器 - 分析字体加载对性能的影响

输入网页 URL，检测所用 Web 字体，评估加载策略并给出优化建议。

开发工具 Web 字体优化加载性能

robots.txt 测试模拟器 - 验证爬虫规则

输入网站robots.txt内容与用户代理，测试指定URL是否被允许抓取，SEO优化辅助。

SEO工具 robots.txt 模拟爬虫规则

振动API测试工具 - 手机马达振动模式调试

使用Vibration API控制设备振动，测试短振、长振和模式振动，验证触觉反馈。

开发工具 API Vibration 振动

数字滤波器设计器 - 低通/高通/带通

在Canvas上绘制理想频率响应，并应用简单FIR滤波器对合成信号进行滤波，听音效对比。

信号处理信号滤波器演示

暖气片热量计算器 - 房间大小与BTU推荐

输入房间面积、窗户数与保温条件，估算所需暖气片的热输出功率。

家装 BTU 供暖暖气计算

增强版字数统计器 - 中英日韩混合精确计数

支持多语言字符分割，准确统计汉字、英文单词、日文假名数量，并评估社交媒体发文长度。

写作工具多语言字数统计字符计数

A/B 测试显著性计算器 - Z 检验与 P 值