本篇内容主要就来讲一讲 likelihood ratio,感觉这部分在大部分的理工科统计中是没有被覆盖的,但却是一个有关 hypothesis test 的重要内容。
一、 简单假设下的似然比检验 (Simple Hypothesis)
似然比检验 (Likelihood Ratio Test, LRT) 提供了一种构造检验统计量(test statistic)的通用方法。首先考虑最简单的情况:检验两个完全指定了概率分布的假设。
1. 定义似然比
假设观测数据 X=(X1,…,Xn) 具有联合概率密度函数或频率函数 f(x∣θ)。我们设定两个简单假设:
- 原假设 (H0): X∼f0(x)
- 备择假设 (HA): X∼fA(x)
在观测到数据 x 后,似然比统计量 LR 定义为:
LR(x)=L(θA∣x)L(θ0∣x)=fA(x)f0(x)
2. 最优性:Neyman-Pearson 引理
Neyman-Pearson 引理证明了基于似然比构造的检验是最优的。最优性是指在固定第一类错误概率 α(显著性水平)时,似然比检验能够提供最大功效 (1−β)。
-
LRT 决策规则 d(x): 如果似然比 LR<c,则拒绝 H0。
dLRT(x)={10if LR<c⟹x prefers HA (Reject H0)if LR≥c⟹x prefers H0 (Fail to reject H0)
-
结论: 在 α 水平下,LRT 是功效最大的检验。
二、 推广到复合假设 (General Case)
在大多数实际问题中,假设是复合假设(Composite Hypothesis)。在这种情况下,我们使用广义似然比检验 (Generalized Likelihood Ratio Test, GLRT)。
1. 广义似然比统计量 (Λ)
假设 Ω 是总参数空间,ω0 是原假设下的参数子空间。广义似然比统计量 (Λ) 的定义为:
Λ=maxθ∈Ω[lik(θ)]maxθ∈ω0[lik(θ)]
- 取值范围: 0≤Λ≤1。
- 拒绝域: 小的 Λ 值支持备择假设,故拒绝域形式为 Λ≤λ0。
2. 拒绝域的确定
临界值 λ0 的选择需要保证检验的显著性水平为 α:
P(Λ≤λ0∣H0)=α
3. 渐近分布:Wilk’s Theorem
对于大样本量,Wilk’s Theorem 提供了 −2logΛ 的渐近分布:
-
定理: 在适当的条件下,当样本量 n→∞ 时,统计量 −2logΛ 的空分布趋近于一个卡方 (χ2) 分布。
-
自由度: 自由度 d 等于参数空间维度的差值:
d=dim(Ω)−dim(ω0)
对于大样本,检验的拒绝域近似为:
拒绝 H0,如果 −2logΛ>χα,d2
Appendix:详细证明与原理
A.1 Neyman-Pearson 引理的核心论证
引理: 对于给定的显著性水平 α,基于似然比 LR(x)=fA(x)f0(x) 构造的检验 d(x) 是最优检验(功效最大)。
证明步骤:
-
定义 LRT 决策函数 d(x):
d(x)={10if f0(x)<cfA(x)⟹cfA(x)−f0(x)>0if f0(x)≥cfA(x)⟹cfA(x)−f0(x)≤0
-
定义约束:
对于任何其他决策规则 d∗(x),必须满足显著性水平约束:
P(d∗(X)=1∣H0)≤P(d(X)=1∣H0)=α
即:
E0[d∗(x)]≤E0[d(x)]
-
建立核心不等式:
对于所有的 x,根据 d(x) 的构造方式,以下不等式成立:
d∗(x)⋅[cfA(x)−f0(x)]≤d(x)⋅[cfA(x)−f0(x)]
-
对不等式两侧求期望(积分):
∫d∗(x)⋅[cfA(x)−f0(x)]dx≤∫d(x)⋅[cfA(x)−f0(x)]dx
展开并转换为期望形式:
c∫d∗(x)fA(x)dx−∫d∗(x)f0(x)dx≤c∫d(x)fA(x)dx−∫d(x)f0(x)dxcEA[d∗(x)]−E0[d∗(x)]≤cEA[d(x)]−E0[d(x)]
-
得出结论 (功效比较):
整理不等式:
E0[d(x)]−E0[d∗(x)]≤c[EA[d(x)]−EA[d∗(x)]]
- 根据约束 (2),不等式左侧 E0[d(x)]−E0[d∗(x)]≥0。
- 由于 c>0。
- 因此,右侧的中括号部分必须是非负的:EA[d(x)]−EA[d∗(x)]≥0。
⟹Power(d)=EA[d(x)]≥EA[d∗(x)]=Power(d∗)
A.2 Wilk’s Theorem 渐近分布的原理
Wilk’s Theorem 阐述了 −2logΛ 的渐近分布为 χ2 分布,自由度为 dim(Ω)−dim(ω0)。
启发式解释:
−2logΛ 统计量渐近等价于皮尔逊卡方统计量,其中皮尔逊卡方统计量本身是 m 个正态随机变量平方和的近似,而 m 个正态随机变量的平方和服从卡方分布。
具体来说,通过将对数似然函数在无约束 MLE 处进行泰勒级数展开,可以证明:
i=1∑mxilog(pi(θ^)xi/n)≈2n1i=1∑mpi(θ^)(xi−npi(θ^))2
左侧的 2n 倍即为 −2logΛ。因此,−2logΛ 渐近等价于右侧的皮尔逊卡方统计量 χ2,其自由度反映了模型在约束解除后增加的自由参数数量。