t- 분포 밀도 함수의 직관


12

학생의 t- 분포에 대해 공부하고 있는데 t- 분포 밀도 함수를 어떻게 도출 할 수 있을지 궁금해지기 시작했습니다 (wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ).

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

여기서 는 자유도이고 는 감마 함수입니다. 이 기능의 직관은 무엇입니까? 이항 분포의 확률 질량 함수를 보면 나에게 의미가 있습니다. 그러나 t- 분포 밀도 함수는 전혀 이해가되지 않습니다. 아니면 종 모양의 곡선이 있고 우리의 요구에 부응한다는 직관입니까?vΓ

어떤 도움을 위해 Thnx :)


3
이 분포에는 단순하고 예쁜 기하학적 해석이 있습니다. 실제로, 학생 (1908)은 지능적인 추측 (몬테카를로 시뮬레이션에 의해 지원됨)을 통해 이러한 형태의 PDF를 처음으로 도출했지만 피셔 (1920 년)는 먼저 기하학적 인 주장으로 그것을 얻었습니다. 본질은 는 구 에서의 (균일하게 분포 된 점) 의 높이 와 그 반경 (축으로부터의 거리)의 비율, 즉 위도의 접선의 비율의 분포를 설명 한다는 것 입니다 . 이것에 대한 하나의 설명은 evolutiondmicrobe.com/Literature/GeometricTDistribution.pdf 에서 제공됩니다 . ν + 1fν+1
whuber

답변:


9

표준 정규 랜덤 변수 와 df를 갖는 독립 카이-제곱 랜덤 변수 있는 경우Q νZQν

T=Z/Q/ν

갖는다 가진 분배 DF한다. ( 가 무엇 으로 배포 되는지 잘 모르겠지만 는 아닙니다 .)ν Z / Q ttνZ/Qt

실제 파생은 상당히 표준적인 결과입니다. Alecos는 여기서 몇 가지 방법을 사용 합니다 .

직관이 진행되는 한, 특정 기능 형태에 대한 특별한 직관은 없지만 분모에 대한 독립적 인 chi-distribution 이 ( 스케일링 됨) 고려하여 모양의 일반적인 감각을 얻을 수 있습니다. 비스듬한:ν

여기에 이미지 설명을 입력하십시오

이 모드는 1보다 약간 낮지 만 (df가 증가함에 따라 1에 가까워짐) 약간의 값이 실질적으로 1보다 크거나 작습니다. 의 변동은 의 분산 이 의 . 의 값 실질적으로 상기 1가 이어질 것이다 - 값보다도 0에 가까울 있다는 대략 1 아래의 것들을 초래 반면, 인 - 값보다도 0으로부터 상기 있다는 이다. tZQ/νtZ tZtZQ/νtZtZ

이 모든 것은 값이 (i) 더 가변적이며, (ii) 정상보다 상대적으로 더 정점이 높고 (iii) 더 무겁다는 것을 의미합니다. df가 증가함에 따라 는 1 주위로 집중되고 는 정상에 더 가깝습니다.t tQ/νt

여기에 이미지 설명을 입력하십시오

( '상대적으로 더 높은 피크'는 스프레드에 비해 약간 더 높은 피크를 생성하지만 분산이 클수록 중심이 아래로 당겨 져서 df가 낮을수록 피크가 약간 낮아집니다)

이것이 왜 가 그렇게 보이는지 에 대한 직관 입니다.t


1
나는 나의 설명에서 약간 조잡했다. 물론 그것은 자유 도로 나눈 카이 제곱 분포 랜덤 변수의 제곱근이었습니다.
Analyst

@Analyst 저는 같은 일을 두 번 이상했습니다.
Glen_b-복원 모니카

9

Glen의 대답은 정답이지만 베이지안 관점에서 t- 분포를 다른 분산을 갖는 정규 분포의 연속 혼합으로 생각하면 도움이됩니다. 여기서 파생을 찾을 수 있습니다.

가우스 혼합으로 학생 t

이 접근 방식은 모집단의 정확한 변동성을 모르는 경우 t- 분포가 발생하는 방식을 명확히하기 때문에 직관에 도움이된다고 생각합니다.


2
여기 정규 분포의 혼합물로서 t 분포의 애니메이션을 만들었다 : sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
라스무스 바트
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.