정규 분포보다 꼬리가 두꺼운 t- 분포


10

강의 노트에서

t- 분포는 약간 무겁지만 꼬리는 보통처럼 보입니다.

(중앙 한계 정리로 인해) 왜 정상적으로 보일지 이해합니다. 그러나 정규 분포보다 꼬리가 무겁다는 것을 수학적으로 증명하는 방법과 정규 분포보다 무거운 정도를 측정하는 방법이 있는지 이해하는 데 어려움을 겪고 있습니다.

답변:


12

가장 먼저 할 일은 "무거운 꼬리"라는 의미를 공식화하는 것입니다. 개념적으로 두 분포를 동일한 위치와 스케일 (예 : 표준 편차)로 표준화 한 후 극단의 밀도가 얼마나 높은지를 볼 수 있습니다.

여기에 이미지 설명을 입력하십시오
( 이 답변에서 귀하의 질문과 다소 관련이 있습니다 )

[이 경우 스케일링은 실제로 중요하지 않습니다. 매우 다른 스케일을 사용하더라도 t는 여전히 정상보다 "무거워집니다". 보통은 항상 낮아진다]

그러나이 정의는이 특정 비교에 적합하지만 일반화되지는 않습니다.

더 일반적으로 더 나은 정의는 whuber의 대답 입니다. 따라서 가 보다 테일 인 경우 , 가 충분히 커짐에 따라 (모두 일부 ) , 여기서 . 여기서 는 cdf입니다 (무거운 경우) 오른쪽에 꼬리가 있습니다; 다른 쪽에도 비슷하고 명백한 정의가 있습니다).YXtt>t0SY(t)>SX(t)S=1FF

여기에 이미지 설명을 입력하십시오

여기에 로그 스케일과 노멀의 Quantile 스케일이 있으며,이를 통해 더 자세히 볼 수 있습니다.

여기에 이미지 설명을 입력하십시오

따라서 두꺼운 꼬리의 "증거"는 cdfs를 비교하고 t-cdf의 상단 꼬리가 항상 정상보다 위에 있고 t-cdf의 하단 꼬리가 항상 항상 정상보다 낮음을 보여줍니다.

이 경우 가장 쉬운 방법은 밀도를 비교 한 다음 cdfs (/ survivor functions)의 해당 상대 위치가 그 뒤를 따라야한다는 것을 보여주는 것입니다.

예를 들어 (어떤 주어진 )ν

x2(ν+1)log(1+x2ν)>2log(k)

필요한 상수에 대해 (의 함수 ), 모든 일부 다음이를위한 무거운 꼬리를 확립 할 수있을 것이다 과 같은 큰 관점에서의 정의에 (또는 더 큰 에 왼쪽 꼬리).kνx>x0tν1FF

(이 형식은 밀도 유지간에 필요한 관계가있는 경우 밀도 로그의 차이에서 비롯됨)

[실제로 특정 밀도 정규화 상수에서 오는 특정 뿐만 아니라 모든 대해 표시 할 수 있으므로 결과는 필요한 대해 유지되어야 합니다.]kk


1
있는 그래프 (그리고 아마도 를 약간 확장 )는 더 두꺼운 꼬리를 더 명확하게 보여줄 수 있으며 더 높은 자유도를 발휘할 수도 있습니다.logS(x)x
Henry

1
@ 헨리 (Henry) 나는 그러한 음모를 생성했지만 그것이 얼마나 많은 가치를 추가했는지 확실하지 않아 포함시키지 않았다. 그것을 넣을 까 생각하겠습니다.
Glen_b-복지국 Monica

1
@ 헨리 나는 줄거리를 포함시켰다.
Glen_b-복지 주 모니카

2

차이점을 보는 한 가지 방법은 순간E{xn}.

"무거운"테일은 분산이 동일 할 때 짝수 파워 모멘트 (파워 4, 6, 8)에 대해 더 높은 값을 의미합니다. 특히, 4 차 모멘트 (0 부근)는 첨도라고하며, 어떤 의미에서는 꼬리의 무거움을 비교합니다.

자세한 내용은 Wikipedia를 참조하십시오 ( https://en.wikipedia.org/wiki/Kurtosis )


1
A에 대한 비록 와 - 분포 또는 자유도, 함께있는 동안 첨도는 무한 당신이 첨도를 계산 할 수 있도록 자유도 표준 편차는 무한하고, 함께 자유도 당신도 평균을 계산하거나 수 없습니다 번째 순간. t34214
Henry

3
@Henry 그럼에도 불구하고이 아이디어는 좋습니다. 주위 의 Student 분포 의 CDF를 확장하면 비례 적으로 비례 함을 알 수 있습니다. 따라서 미만의 모든 절대 무게 모멘트가 존재하고 보다 큰 모든 절대 무게 모멘트가 분기됩니다. 정규 분포를 사용하면 모든 절대 모멘트가 존재합니다. 이것은 모든 스튜던트 분포와 정규 분포 의 꼬리에 대한 명확한 순서를 제공합니다 . 실제로 매개 변수 는 꼬리의 무거움을 측정하는 방법에 대한 원래의 질문에 대한 답을 제공합니다. t(ν)+xνννtν
whuber

2

다음은 생존 함수를 기반으로 한 공식적인 증거입니다. 나는 wikipedia에서 영감을 얻은 "무거운 꼬리"의 다음 정의를 사용합니다 .

생존 함수 갖는 랜덤 변수 는 랜덤 변수보다 꼬리가 무겁습니다.YSy(t)X 생존 기능 Sx(t) iff

limtSy(t)Sx(t)=

평균 0, 자유도 및 척도 모수 갖는 스튜던트 t로 분포 된 랜덤 변수 고려하십시오 . 이것을 랜덤 변수 합니다. 두 변수 모두 생존 함수를 구별 할 수 있습니다. 따라서, YνaXN(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
여기서 대체했습니다 . 참고 인 상수 및 따라서 대수 한계 정리에 따라 u=t2/a20<a2/σ2<limuC/u=0
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

중요하게도 결과는 , 및 임의의 (유한) 값을 보유 하므로 분포에서 정규 분포보다 분산이 더 작지만 꼬리가 더 무거운 경우가있을 수 있습니다.aσ2ν


1
더 두꺼운 꼬리의 "정의"가 항상 허용되는 것은 아닙니다. 예를 들어,이 정의에 따르면 N (0,1) 분포는 후자 분포가 생성하더라도 .9999 * U (-1,1) + .0001 * U (-1000, 1000) 분포보다 꼬리가 무겁습니다. 제한적인지지에도 불구하고 평균에서 최대 175 개의 표준 편차가 있습니다. 물론 N (0,1)도 이러한 값을 생성하지만 실제 목적과 관련하여 고려할 수있는 것보다 훨씬 낮은 확률을 갖습니다.
피터 웨스트 폴
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.