비정규 표본의 표본 분산에 대한 점근 분포


19

이것은 이 질문 에 의해 제기 된 문제에 대한보다 일반적인 처리입니다 . 표본 분산의 점근 분포를 도출 한 후 델타 방법을 적용하여 표준 편차의 해당 분포에 도달 할 수 있습니다.

크기가 인 iid 비정규 랜덤 변수 , 평균 및 분산 . 표본 평균과 표본 분산을 { X i } ,n{Xi},i=1,...,nμσ2

x¯=1ni=1nXi,s2=1n1i=1n(Xix¯)2

우리는

E(s2)=σ2,Var(s2)=1n(μ4n3n1σ4)

여기서 이고, 어떤 순간이 존재하고 유한하며 존재하고 유한해야하는 분포에주의를 제한합니다.μ4=E(Xiμ)4

그것은 개최합니까

(에스2σ2)(0,μ4σ4)?

허. 방금 다른 스레드에 게시했지만이 게시물을 게시했다는 사실을 깨닫지 못했습니다. 분산에 적용된 CLT에는 여러 가지 사항이 있습니다 (예 : p3-4 ). 좋은 대답 btw.
Glen_b-복지국 Monica

감사. 예, 이것을 찾았습니다. 그러나 @whuber가 지적한 사례를 놓쳤다. 그들은 심지어 일반적인 로 Bernoulli 예제를 제공합니다 ! (4 페이지의 기초). 사례도 포함하도록 답변을 연장하고 있습니다. p=1/2
Alecos Papadopoulos

예, 나는 그들이 Bernoulli를 고려했지만 그 특별한 경우를 고려하지 않은 것을 보았습니다. 나는 확장 된 Bernoulli (동등한 이분법 적 사례)에 대한 구별에 대한 언급이 (몇 가지 다른 것 중에서도) 왜 (댓글이 아닌) 여기에 대답하여 논의하는 것이 가치가 있는지 한 가지 이유라고 생각합니다. 검색 할 수 있습니다.
Glen_b-복지국 모니카

답변:


20

표본 분산을 고려할 때 발생하는 부수적 인 종속 관계에 대해 다음과 같이 씁니다.

(n1)s2=i=1n((Xiμ)(x¯μ))2

=i=1n(Xiμ)22i=1n((Xiμ)(x¯μ))+i=1n(x¯μ)2

조금 조작 한 후에

=나는=1(엑스나는μ)2(엑스¯μ)2

따라서

(에스2σ2)=1나는=1(엑스나는μ)2σ21(엑스¯μ)2

조작,

(에스2σ2)=1나는=1(엑스나는μ)211σ21(엑스¯μ)2

=11나는=1(엑스나는μ)211σ21(엑스¯μ)2

=1[(1나는=1(엑스나는μ)2σ2)]+1σ21(엑스¯μ)2

용어 은 무증상으로 통일된다. 라는 용어 는 결정적이며 로 0이됩니다 .n/(n1)nnn1σ2n

또한 . 첫 번째 성분은 정규 분포로 수렴하고, 두 번째 성분은 확률은 0으로 수렴합니다. 그런 다음 Slutsky의 정리에 따라 곱은 0으로 수렴합니다.n(x¯μ)2=[n(x¯μ)](x¯μ)

n(x¯μ)20

우리는 그 용어가 남았습니다

[(1나는=1(엑스나는μ)2σ2)]

이 답변 에 대한 의견에서 @whuber가 제공 한 치명적인 예제에 경고를 보내면 가 일정하지 확인하고 싶습니다 . Whuber는 가 Bernoulli 이면이 양은 상수 라고 지적했습니다 . 따라서이 일이 발생하는 변수 (아마도 이진이 아닌 다른 이분법 )를 제외하면 나머지는X i ( 1(엑스나는μ)2엑스나는0 / 1(1/2)0/1

이자형(엑스나는μ)2=σ2,바르[(엑스나는μ)2]=μ4σ4

따라서 조사중인 용어는 고전적인 Central Limit Theorem의 일반적인 주제입니다.

(에스2σ2)(0,μ4σ4)

참고 : 위의 코스 결과는 정규 분포 샘플에도 적용되지만이 경우에는 유한 샘플 카이 제곱 분포 결과도 사용할 수 있습니다.


3
+1 일반적인 이분법 분포는 모두 Bernoulli의 규모와 위치 버전이므로 Bernoulli에 대한 분석이 충분하기 때문에 확인할 필요가 없습니다. 내 시뮬레이션 (샘플 크기 )은 결과를 확인합니다 . x 2 1101000χ12
whuber

@whuber 감사합니다. 당신은 물론 Benroulli가 그들 모두의 어머니가되는 것에 대해 옳습니다.
Alecos Papadopoulos

10

귀하는 이미 귀하의 질문에 대한 자세한 답변을 가지고 있지만 다른 질문을 제안 해 드리겠습니다. 사실, 더 짧은 증거는

S2=1n1i=1n(XiX¯)2

에 의존하지 않습니다 . 점근, 그것은 또한 우리가 요소 변경 여부를 중요하지 않습니다 에 나는 편의를 위해 할 것입니다. 우리는 다음1E(X)=ξ 11n11n

n(S2σ2)=n[1ni=1nXi2X¯2σ2]

그리고 이제 일반성을 잃지 않고 이라고 가정 하고ξ=0

nX¯2=1n(nX¯)2

두 번째 항이 (CLT 및 연속 매핑 정리에 의해) 확률로 제한되기 때문에 확률 한계는 0입니다. 즉, 입니다. 점근 결과는 이제 Slutzky의 정리와 CLT에서 따릅니다.Op(1)

n[1nXi2σ2]DN(0,τ2)

여기서 . 그리고 그렇게 할 것입니다.τ2=Var{X2}=E(X4)(E(X2))2


이것은 확실히 더 경제적입니다. 그러나 가정 이 얼마나 무해한 지 다시 생각해보십시오 . 예를 들어 Bernoulli ( ) 샘플 의 경우는 제외하고 답변 끝에 언급했듯이 이러한 샘플에 대해서는이 점근 적 결과가 유지되지 않습니다. P = 1 / 2E(X)=0p=1/2
Alecos Papadopoulos 2016

@AlecosPapadopoulos 실제로 데이터는 항상 중앙에 위치 할 수 있습니까? 나는 이 변수로 작업 할 수 있습니다. 베르누이 사건의 경우, 우리가 그렇게하지 못하게 막는 것이 있습니까?
i=1n(Xiμ(X¯μ))2=i=1n(XiX¯)2
JohnK

@AlecosPapadopoulos 아 그래, 문제가 보인다.
JohnK

나는 그 문제에 대해 작은 글을 썼다. 내 블로그에 올릴 때가되었다고 생각한다. 읽고 싶은 경우에 알려 드리겠습니다. 이 경우 표본 분산의 점근 분포는 흥미롭고 표본 표준 편차의 점근 분포는 훨씬 더 흥미 롭습니다. 이 결과는 이분법 랜덤 변수에 대해 유지됩니다. p=1/2
Alecos Papadopoulos 2016

1
멍청한 질문이지만 가 정상이 아닌 경우 가 부수적 이라고 어떻게 가정 할 수 있습니까? 또는 항상 부수적이지만 (평균적인 매개 변수화는 추측하지만) 표본 평균이 Basu의 정리에 의해 충분한 통계량 (즉, 정규 분포) 일 때만 표본 평균과 독립적입니까? X i S 2S2XiS2
Chill2Macht 17

3

AlecosJohnK 의 탁월한 답변은 이미 결과를 도출했지만 표본 분산의 점근 적 분포에 대해 다른 점에 주목하고 싶습니다.

정규 분포를 사용하여 표현 된 점근 적 결과를 보는 것이 일반적이며 이론 정리에 유용합니다. 그러나 실제로는 표본 통계량에 대한 점근 분포의 목적은 이 클 때 근사 분포를 얻을 수 있다는 것 입니다. 많은 분포가 동일한 점근 형태를 갖기 때문에 큰 표본 근사에 대해 선택할 수있는 항목이 많이 있습니다. 표본 분산의 경우 큰 대한 우수한 근사 분포 는 다음과 같이 나타납니다. n

에스2σ2카이-제곱(df=에프)에프,

여기서 및 는 첨도 매개 변수입니다. 이 분포는 정리에서 파생 된 정규 근사와 거의 동일합니다 (자유도가 무한대 인 경향에 따라 카이 제곱 분포가 정규로 수렴 됨). 이 동등성에도 불구하고이 근사값에는 근사 분포에 원하는 다양한 속성이 있습니다.κ = μ 4 / σ 4에프2/V(에스2/σ2)=2/(κ()/(1))κ=μ4/σ4

  • 정리에서 직접 도출 된 정규 근사와 달리이 분포는 관심 통계를 올바르게 지원합니다. 표본 분산은 음수가 아니고이 분포는 음이 아닌지지를 갖습니다.

  • 기본 값이 정규 분포 인 경우이 근사값은 실제로 정확한 샘플링 분포입니다. (이 경우 우리는 이 , 이것은 대부분의 텍스트에서 사용되는 표준 형식입니다.) 따라서 중요한 특수한 경우에도 정확한 결과를 구성하지만 더 일반적인 경우.D F n = n 1κ=에프=1


위 결과의 도출 : 표본 평균 및 분산에 대한 대략적인 분포 결과는 O'Neill (2014) 에서 상세히 논의되었으며 ,이 논문은 현재 근사 분포를 포함하여 많은 결과의 도출을 제공합니다.

이 파생은 질문의 제한 결과에서 시작됩니다.

(에스2σ2)(0,σ4(κ1)).

이 결과를 다시 정렬하면 근사값을 얻습니다.

에스2σ2(1,κ1).

카이 제곱 분포는 무정형 정규이므로 는 다음과 같습니다.에프

카이-제곱(에프)에프1에프(에프,2에프)=(1,2에프).

촬영 (상기 식을 산출) 부여합니다 카이 제곱 분포 점근하는 보장하지만 것을 제한 정리의 정규 근사값과 같습니다.에프2/V(에스2/σ2)에프2/(κ1)


실험적으로 흥미로운 질문 중 하나는이 두 가지 점근선 결과 중 다양한 기본 데이터 분포 하에서 유한 샘플 사례에서 더 잘 작동한다는 것입니다.
lzstat

예, 저는 이것이 매우 흥미롭고 출판 가능한 시뮬레이션 연구라고 생각합니다. 본 공식은 표본 분산의 분산에 대한 첨도 보정을 기반으로하기 때문에, mesokurtic에서 멀리 떨어진 첨도 모수를 갖는 기본 분포 (예 : 첨도- 수정이 가장 중요합니다). 첨도는 표본에서 추정 할 필요가 있기 때문에 전반적인 성능이 크게 개선 될시기에 대해서는 미심쩍은 질문입니다.
복원 Monica Monica
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.