这很不幸,因为重复是任何统计测试的核心。你需要多次重复才能看到结果。我在这里特别要说的是,你经常会看到置信区间。你会看到有人说我们有95%的把握,广告一比广告二更好,或者这个文案的转化率比那个文案更高,或者把结账按钮放在这里比放在那里转化率更高。这个95%的数字来自统计测试。
它的意思是
它假设了试验的很大一部分独立性,但 电报筛查 质上是说,如果两个条件相同,偶然出现如此极端结果差异的概率小于5%。换句话说,这种情况偶然发生的概率不到20分之一。 现在的问题在于,我们倾向于并行或顺序运行大量此类测试。这其实并不重要。假设你正在进行转化率优化测试,你逐一调整了20项内容。
每次你根据这个模型进行测试时
你会说,首先,我要把按钮 如何从黑帽 SEO 处罚中恢复 从红色改为绿色。然后,我要更改按钮上的文本。然后,我要更改按钮附近的文本。最后,我要更改其他内容。你就这样沿着测试树往下走。每次结果都显示,没有,这没有区别,或者统计上没有显著差异。没有,这没有区别。没有,这没有区别。假设你进行了15次这样的测试。
在第16次你得到的结果显示
是的,这有区别。我们有95%的把握这 原创评论 确实有区别。但想想这实际上意味着什么。也就是说,当你测试的两件事实际上完全相同时,随机发生的概率是二十分之一。我们可能预期二十分之一才会发生的事情,在第十六次发生时才有可能出现。这没什么不寻常的。所以,实际上,我们的测试是有缺陷的。