我们先从单总体的情况开始讲起,建立假设为

H0:μ=0vsH1:μ0H_0: \mu = 0 \quad \mathrm{vs} \quad H_1: \mu \ne 0

假设方差已知,样本均值为x\overline{x},为了控制犯第一类错误的概率,由于P(uu1α/2)=αP(|u| \ge u_{1 - \alpha/2}) = \alpha,因此

u=xμσ/nu1α/2xσnu1α/2|u| = \frac{|\overline{x} - \mu|}{\sigma/\sqrt{n}} \ge u_{1 - \alpha/2} \quad \Rightarrow \quad |\overline{x}| \ge \frac{\sigma}{\sqrt{n}} u_{1 - \alpha/2}

注意,这里我们讨论的是第一类错误,因此μ=0\mu = 0

满足上述条件可以控制第一类错误,在此基础上,我们还需要控制犯第二类错误的概率。需要注意到,在双侧检验中讨论第二类错误时,由于μ\mu不可能同时大于0及小于0,因此,我们需要分类讨论。当μ>0\mu > 0时,记其为μ1\mu_1,也就是说xN(μ1,σ2/n)\overline{x} \sim N(\mu_1, \sigma^2/n),对于第二类错误,我们一般会考虑正确率,也就是1β1 - \beta,即

P(xσnu1α/2)1βP(xμ1σ/nσnu1α/2μ1σ/n)1βP(\overline{x} \ge \frac{\sigma}{\sqrt{n}} u_{1 - \alpha/2}) \ge 1 - \beta \quad \Rightarrow \quad P(\frac{\overline{x} - \mu_1}{\sigma/\sqrt{n}} \ge \frac{\frac{\sigma}{\sqrt{n}} u_{1 - \alpha/2} - \mu_1}{\sigma/\sqrt{n}}) \ge 1 - \beta

由于xμ1σ/nN(0,1)\frac{\overline{x} - \mu_1}{\sigma/\sqrt{n}} \sim N(0, 1),结合正态分布图像,可得

σnu1α/2μ1σ/nu1βnσ2μ12(u1α/2+u1β)2\frac{\frac{\sigma}{\sqrt{n}} u_{1 - \alpha/2} - \mu_1}{\sigma/\sqrt{n}} \le -u_{1 - \beta} \quad \Rightarrow \quad n \ge \frac{\sigma^2}{\mu_1^2}(u_{1 - \alpha/2} + u_{1 - \beta})^2

μ<0\mu < 0时,P(xσnu1α/2)=P(xσnu1α/2)P(\overline{x} \le -\frac{\sigma}{\sqrt{n}} u_{1 - \alpha/2}) = P(\overline{x} \ge \frac{\sigma}{\sqrt{n}} u_{1 - \alpha/2}),因此与上述情况相同。至此我们可以得到单总体的最小样本量公式为

σ2μ12(u1α/2+u1β)2\frac{\sigma^2}{\mu_1^2}(u_{1 - \alpha/2} + u_{1 - \beta})^2

接着,我们来推导双总体的情况,其假设改写为

H0:μ1μ2=0vsH1:μ1μ20H_0: \mu_1 - \mu_2 = 0 \quad \mathrm{vs} \quad H_1: \mu_1 - \mu_2 \ne 0

假设样本均值为x\overline{x}y\overline{y},样本量为mmnn,样本方差为σ12\sigma_1^2σ22\sigma_2^2,为了控制犯第一类错误的概率,由于P(uu1α/2)=αP(|u| \ge u_{1 - \alpha/2}) = \alpha,因此

u=xyσ12m+σ22nu1α/2xyσ12m+σ22nu1α/2|u| = \frac{|\overline{x} - \overline{y}|}{\sqrt{\frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n}}} \ge u_{1 - \alpha/2} \quad \Rightarrow \quad |\overline{x} - \overline{y}| \ge \sqrt{\frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n}} u_{1 - \alpha/2}

在此基础上我们控制第二类错误,假设Δ=μ1μ2>0\Delta = \mu_1 - \mu_2 > 0,则xyN(Δ,σ12m+σ22n)\overline{x} - \overline{y} \sim N(\Delta, \frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n})

P(xyσ12m+σ22nu1α/2)1βP(xyΔσ12m+σ22nσ12m+σ22nu1α/2Δσ12m+σ22n)1βP(\overline{x} - \overline{y} \ge \sqrt{\frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n}} u_{1 - \alpha/2}) \ge 1 - \beta \quad \Rightarrow \quad P(\frac{\overline{x} - \overline{y} - \Delta}{\sqrt{\frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n}}} \ge \frac{\sqrt{\frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n}} u_{1 - \alpha/2} - \Delta}{\sqrt{\frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n}}}) \ge 1 - \beta

由于xyΔσ12m+σ22nN(0,1)\frac{\overline{x} - \overline{y} - \Delta}{\sqrt{\frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n}}} \sim N(0, 1),结合正态分布图像,记k1m=nk_1m = nk2σ12=σ22k_2\sigma_1^2 = \sigma_2^2,可得

σ12m+σ22nu1α/2Δσ12m+σ22nu1βn(k1+k2k1)σ22Δ2(u1α/2+u1β)2\frac{\sqrt{\frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n}} u_{1 - \alpha/2} - \Delta}{\sqrt{\frac{\sigma_1^2}{m} + \frac{\sigma_2^2}{n}}} \le -u_{1 - \beta} \quad \Rightarrow \quad n \ge (\frac{k_1 + k_2}{k_1})\frac{\sigma_2^2}{\Delta^2}(u_{1 - \alpha/2} + u_{1 - \beta})^2

由于A/B测试是要在测试之前就确定最小样本量的,因此,我们无法计算样本方差用于代替方差,对此,我们一般会对现有数据计算方差,并用其代替实验组与对照组的方差。且考虑到,一般A/B测试中的实验组与对照组的样本数是相同的。综上,可得k1=1k_1 = 1k2=1k_2 = 1,上述公式可简化为

σ2Δ2(u1α/2+u1β)2\frac{\sigma^2}{\Delta^2}(u_{1 - \alpha/2} + u_{1 - \beta})^2

这也就是我们熟知的最小样本量公式。