假設檢定 (Hypothesis Testing)
- 虛無假設(null hypothesis):H0
- 對立假設(alternative hypothesis):H1
- 型一誤差(type I error):拒絕 H0 但 H0 為真
顯著水準(significance level):α=P(Type I error)
- 型二誤差(type II error):接受 H0 但 H0 為假
功效(power):1−β=P(Reject H0∣H1 is true)
|
H0 |
H1 |
accept H0 |
1−α |
β |
reject H0 |
α |
1−β |
Example: Normal Distribution
Let X1,X2,...,Xn∼iidN(μ,σ2), μ is unknown, σ2 is known
Goal: Find a level α test for H0:μ=μ0 vs H1:μ=μ0
- 在虛無假設下,
X1,X2,...,Xn∼iidN(μ0,σ2)⇒Xˉn∼N(μ0,nσ2)⇒σn(Xˉn−μ0)∼H0N(0,1)
- 存在一個常數 c>0,使得 α=P(∣Xˉn−μ0∣>c∣H0)=P(σ/n∣Xˉn−μ0∣>σ/nc)=P(Z>σ/nc)+P(Z<−σ/nc)
- 因此,我們可以選擇 c=Z(2α)nσ,使得 α⎩⎪⎪⎨⎪⎪⎧10if ∣Xˉn−μ0∣>Z(2α)nσif ∣Xˉn−μ0∣≤Z(2α)nσ
Student’s t-distribution
觀察到的顯著性p值 (obsereved significance p-value)
t∗ 為觀察到的檢定統計量,p-value=2min{P(T≥t∗∣H0),P(T≤t∗∣H0)}=P(∣T∣≥∣t∗∣∣H0)
p-value 是觀察到的檢定統計量 t∗ 的機率,當虛無假設為真時,觀察到更極端的機率
t-test
令 X1,X2,...,Xn∼iidN(μ,σ2), μ 和 σ2 未知
-
虛無假設: H0:μ=μ0 vs H1:μ=μ0 對 α 水準的檢定, 我們想找 c 使得: α=P(∣Xˉn−μ0∣>c∣H0)=P(S/n∣Xˉn−μ0∣>c)=P(∣tn−1∣>c)=P(tn−1>c)+P(tn−1<−c)
-
設 c=tn−1(2α)α⎩⎪⎪⎨⎪⎪⎧10if ∣tn−1∣>tn−1(2α)if ∣tn−1∣≤tn−1(2α)
Two-sample t-test
令 X1,X2,...,Xm∼iidN(μ1,σ2), Y1,Y2,...,Yn∼iidN(μ2,σ2)
-
假設:
- 有同樣的變異數 σ2
- Xi 和 Yj 獨立
- μ1, μ2, σ2 都未知
-
虛無假設:H0:μ1=μ2 vs H1:μ1=μ2 如果 H0 為真,則 Xˉn≈Yˉm
-
找到 Xn,Ym 的分布 ⎩⎪⎨⎪⎧Xˉn∼N(μ1,nσ2)Yˉm∼N(μ2,mσ2)⇒Xˉn−Yˉm∼N(μ1−μ2,σ2[(1/n)+(1/m)])⇒σ(1/n)+(1/m)(Xˉn−Yˉm)−(μ1−μ2)∼N(0,1)
-
有 σ2(n−1)S12+σ2(m−1)S22∼χ2(n+m−2)⇒E(σ2(n−1)S12)+E(σ2(m−1)S22)=n+m−2⇒E(Sp2)=σ2
因此,我們可知 Sp(1/n)+(1/m)(Xˉn−Yˉm)−(μ1−μ2)∼t(n+m−2)
-
在虛無假設下,我們可以選擇 c=tn+m−2(2α),使得 α⎩⎪⎪⎨⎪⎪⎧10if ∣tn+m−2∣>tn+m−2(2α)if ∣tn+m−2∣≤tn+m−2(2α)
是在虛無假設下的 α 水準的檢定