개요
샘플 중앙값에 대한 중앙 한계 정리에 설명 된 구성의 일부를 다시 발견 했으며 , 이는 샘플 의 중앙값 분석을 보여줍니다. (분석 분명히 적용 준용를 , 어떤 분위수에,뿐만 아니라 중간 값). 따라서 (큰 샘플에 해당하는) 큰 베타 매개 변수의 경우 문제에 설명 된 변환에서 정규 분포가 발생한다는 것은 놀라운 일이 아닙니다. 중요한 것은 분포가 작은 베타 매개 변수에 대해서도 정규에 얼마나 가까운 지 입니다. 설명이 필요합니다.
아래에 분석을 스케치하겠습니다. 이 게시물을 적당한 길이로 유지하려면 많은 제안이 필요합니다. 핵심 아이디어 만 지적하고자합니다. 따라서 결과를 여기에 요약하겠습니다.
때 에 가까운 β , 모든 것이 대칭이다. 이로 인해 변환 된 분포가 이미 정상으로 보입니다.αβ
형식의 함수는 작은 값의 α 및 β ( 1을 초과 하고 비율이 너무 높지 않은 경우에도)에서 처음에는 보통 정상으로 보입니다. 0 또는 1에 가까움 ).Φα−1(x)(1−Φ(x))β−1αβ101
변환 된 분포의 명백한 정규성은 밀도가 (2)의 함수를 곱한 정규 밀도로 구성되어 있기 때문입니다.
마찬가지로 와 β 증가, 정규성에서 출발은 로그 밀도 테일러 시리즈의 나머지로 측정 할 수있다. 차수 n 의 항은 α 와 β 의 ( n - 2 ) / 2 제곱 에 비례하여 감소 합니다. 이는 결국 충분히 큰 α 및 β 에 대해 n = 3 이상의 모든 항의 항이 상대적으로 작아 져 2 차만 남게됩니다. 이는 정확히 정규 분포의 로그 밀도입니다.αβn(n−2)/2αβαβn=3
종합적으로, 이러한 거동은 작은 및 β 의 경우에도 iid Normal 샘플의 극한이 아닌 Quantile이 대략 Normal 인 이유를 잘 설명 합니다.αβ
분석
그것을 일반화하는 것이 유용 할 수 있기 때문에,하자 될 수 있는 우리가 염두에두고 있지만, 분포 함수 F = Φ .FF=Φ
베타 ( α , β ) 변수 의 밀도 함수 는 정의에 따라g(y)(α,β)
yα−1(1−y)β−1dy.
시키는 확률 적분으로 변환 될 X 및 기록 F 의 유도체 F하는 것으로, 그것은 즉각적 X가 에 비례하는 밀도y=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
이것은 강력한 단봉 분포 (단일 베타)의 단조로운 변환이기 때문에 가 다소 이상 하지 않으면 변환 된 분포도 단봉이됩니다. 노멀에 얼마나 가까운 지 연구하기 위해 밀도의 로그를 살펴 보겠습니다.F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
여기서 는 관련이없는 정규화 상수입니다.C
Taylor 시리즈에서 의 성분을 확장하여 값 x 0 주위에 3을 정렬합니다 (이는 모드에 가깝습니다). 예를 들어, 로그 F 의 확장을 다음 과 같이 쓸 수 있습니다.logG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
몇 동안 | h | ≤ | x − x 0 | . log ( 1 - F ) 와 log f에 대해 비슷한 표기법을 사용하십시오 . h|h|≤|x−x0|log(1−F)logf
선형 항
따라서 의 선형 항 은(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
경우 의 모드 G는 (x0 이 식은 0입니다. 계수는 x 0 의 연속 함수이므로 α 및 β 가변하기때문에 모드 x 0 도 연속적으로 변합니다. 또한, 일단 α 및 β 가 충분히 크면, c f 1 항은 비교적 중요하지 않게된다. 우리는 한계를 연구하는 것을 목표로하면 α → ∞ 및 β → ∞ 되는 α : β 일정 비율의 숙박 γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ따라서 우리는 한번에 모든 기준점 을 선택할 수 있습니다.x0
γcF1+c1−F1=0.
좋은 예는 이고, 여기서 α = β 이며, F 는 약 0 입니다. 이 경우는 명백한 X 0 = F ( 0 ) = 1 / 2 .γ=1α=βF0x0=F(0)=1/2
우리는 (a) 한계에서 테일러 시리즈의 1 차 항이 사라지고 (b) 방금 설명한 특별한 경우 1 차 항이 항상 0 인 방법을 달성했습니다.
Quadratic terms
These are the sum
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
Comparing to a Normal distribution, whose quadratic term is −(1/2)(x−x0)2/σ2, we may estimate that −1/(2g2(α,β)) is approximately the variance of G. Let us standardize G by rescaling x by its square root. we don't really need the details; it suffices to understand that this rescaling is going to multiply the coefficient of (x−x0)n in the Taylor expansion by (−1/(2g2(α,β)))n/2.
Remainder term
Here's the punchline: the term of order n in the Taylor expansion is, according to our notation,
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
표준화 후에는
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
Both of the gi are affine combination of α and β. By raising the denominator to the n/2 power, the net behavior is of order −(n−2)/2 in each of α and β. As these parameters grow large, then, each term in the Taylor expansion after the second decreases to zero asymptotically. In particular, the third-order remainder term becomes arbitrarily small.
The case when F is normal
The vanishing of the remainder term is particularly fast when F is standard Normal, because in this case f(x) is purely quadratic: it contributes nothing to the remainder terms. Consequently, the deviation of G from normality depends solely on the deviation between Fα−1(1−F)β−1 and normality.
This deviation is fairly small even for small α and β. To illustrate, consider the case α=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in x−x0=x.
Here is a plot showing how the standardized fourth order term changes with small values of α>1:
The value starts out at 0 for α=β=1, because then the distribution obviously is Normal (Φ−1 applied to a uniform distribution, which is what Beta(1,1) is, gives a standard Normal distribution). Although it increases rapidly, it tops off at less than 0.008--which is practically indistinguishable from zero. After that the asymptotic reciprocal decay kicks in, making the distribution ever closer to Normal as α increases beyond 2.