제목과의 관계를 명확히하기 위해 t- 분포를 사용하여 평균 을 추정 하는 것이 아니라 (점수 추정의 의미에서) 간격을 구성합니다.
그러나 신뢰 구간을 정확하게 얻을 수있을 때 왜 추정치를 사용합니까?
좋은 질문입니다 ( '정확하게'에 대해 너무 단호하게하지 않는 한, 정확히 t- 분배 된다는 가정은 실제로 유지되지 않기 때문에).
"집단 표준 편차 (σ)를 알 수없고 표본 크기가 작은 경우 (n <30) 작업 문제를 처리 할 때는 t- 분포 표를 사용해야합니다."
모집단 표준 편차를 알 수 없을 때 (n> 30 인 경우에도) 사람들이 항상 T- 분포를 사용하지 않는 이유는 무엇입니까?
나는 그 조언을 기껏해야 오해의 소지가 있다고 생각합니다. 경우에 따라 자유도가 그보다 훨씬 큰 경우에도 t- 분포를 사용해야합니다.
법선이 합리적인 근사치 인 경우 다양한 요인에 따라 달라지며 상황에 따라 다릅니다. 그러나 (컴퓨터의 경우) t 사용하는 것이 전혀 어렵지 않으므로 df가 매우 크더라도 n = 30에서 다른 일을 걱정 해야하는 이유가 궁금합니다.
표본 크기가 실제로 큰 경우 신뢰 구간과 눈에 띄는 차이는 없지만 n = 30이 항상 '실제적으로'크다고 생각하지는 않습니다.
상황이 아닌 정상을 사용하는 것이 합리적 일 수있는 상황이 있습니다 t데이터가 t- 분포를 얻기위한 조건을 분명히 만족시키지 못하지만 평균의 대략적인 정규성을 주장 할 수는 있습니다.n 은 상당히 큽니다). 그러나 이러한 상황에서 종종 t는 실제로 좋은 근사치이며 다소 '거칠다'. [그런 상황에서는 시뮬레이션을 통해 조사하는 경향이 있습니다.]