의 분산은 유한하지 않습니다. Y 알파 안정한 변수 때문이다 와 (a Holtzmark 분포 ) 유한 기대 있는가 하지만 분산은 무한하다. 에 유한 분산 가 있다면 의 독립성 과 분산 정의를 이용하여 계산할 수 있습니다α = 3 / 2 μ Y σ 2 X의 난을Xα=3/2μYσ2Xi
σ2=Var(Y)=E(Y2)−E(Y)2=E(X21X22X23)−E(X1X2X3)2=E(X2)3−(E(X)3)2=(Var(X)+E(X)2)3−μ6=(Var(X)+μ2)3−μ6.
의이 3 차 방정식에는 하나 이상의 실제 해가 있으며 최대 3 개의 해는 있지만 더 이상은 없습니다. 는 유한하지만 암시 하지 않습니다. 이 모순은 그 주장을 증명합니다.Var ( X )Var(X)Var(X)
두 번째 질문으로 넘어 갑시다.
샘플이 커짐에 따라 모든 샘플 Quantile은 실제 Quantile로 수렴됩니다. 다음 몇 단락은이 일반적인 요점을 증명합니다.
관련 확률을 (또는 과 사이의 다른 값 )로 설정하십시오. 가 Quantile이 되도록 분포 함수에 를 씁니다 .0 1 F Z의 Q = F - 1 ( Q ) Q 번째q=0.0101FZq=F−1(q)qth
우리는 (양자 함수)가 연속적 이라고 가정해야합니다 . 이것은 모든 대해 확률 및 가 있음을 보장 합니다. ϵ > 0 q − < q q + > qF−1ϵ>0q−<qq+>q
F(Zq−ϵ)=q−,F(Zq+ϵ)=q+,
그리고 과 같이 간격 의 한계 는 입니다.[ q − , q + ] { q }ϵ→0[q−,q+]{q}
크기가 iid 샘플을 고려하십시오 . 이 표본에서 보다 작은 요소의 개수는 이항 분포 갖습니다. 각 요소는 독립적으로 확률 가 보다 작기 때문 입니다. 중심 한계 정리 (일반적인 것!)는 충분히 큰 에 대해 보다 작은 요소의 수는 평균 및 분산 를 갖는 정규 분포에 의해 주어진다는 것을 의미 합니다. 임의로 좋은 근사치). 표준 정규 분포의 CDF를 . 이 수량이 초과 할Z의 Q - ( Q - , N ) Q - Z의 Q - N Z의 Q - N Q - N (Q) - ( 1 - Q - ) Φ N QnZq−(q−,n)q−Zq−nZq−nq−nq−(1−q−)Φnq 그러므로 임의로
1−Φ(nq−nq−nq−(1−q−)−−−−−−−−−−√)=1−Φ(n−−√q−q−q−(1−q−)−−−−−−−−−√).
오른쪽의 에 대한 인수 는 의 고정 배수 이므로 이 증가 함에 따라 임의로 커집니다 . 이후 CDF, 그 값은 임의로 확대 접근법 이 확률의 한계 값이 0 보여준다.√Φ nΦ1n−−√nΦ1
즉 : 한계에, 그 경우 거의 확실하다 샘플 요소가 이하보다 . 비슷한 주장은 샘플 요소의 가 보다 크지 않다는 것을 거의 증명합니다 . 함께, 이것은 충분히 큰 샘플 의 Quantile이 과 사이에있을 가능성이 매우 큽니다 .Z q - n q Z q + q Z q - ϵ Z q + ϵnqZq−nqZq+qZq−ϵZq+ϵ
이것이 시뮬레이션이 작동한다는 것을 알기 위해 필요한 전부입니다. 원하는 정도의 정확도 및 신뢰 수준 선택할 수 있으며 충분히 큰 표본 크기 에 대해 해당 표본에서 에 가장 가까운 차수 통계량 은 이내 일 가능성이 있음 을 있습니다. 진정한 Quantile 의 .1 − α n n q 1 − α ϵ Z qϵ1−αnnq1−αϵZq
시뮬레이션이 작동한다는 것을 확립하면 나머지는 쉽습니다. 이항 분포의 한계에서 신뢰 한계를 얻은 다음 역변환 할 수 있습니다. 더 자세한 설명 ( 분위수에 대한 것이지만 모든 분위수에 일반화)은 샘플 중앙값에 대한 중앙 한계 정리 의 답에서 찾을 수 있습니다 .q=0.50
의 분위수 는 음수입니다. 샘플링 분포가 크게 왜곡됩니다. 왜곡을 줄이기 위해이 그림은 값의 시뮬레이션 된 1,000 개 표본의 음 의 로그에 대한 히스토그램을 보여줍니다 .Y n = 300 Yq=0.01Yn=300Y
library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3
Y.q <- replicate(n.sim, {
Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE,
main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
xlab="Log(-Y_q)",
sub=paste("Median is", signif(m, 4),
"Negative log is", signif(log(-m), 4)),
cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)