배경 : 저는 가설 테스트 작업에서 동료들에게 프리젠 테이션을하고 있으며, 대부분의 내용을 잘 이해하고 있지만, 이해하고 다른 사람들에게 설명하기 위해 매듭을 짓고있는 한 가지 측면이 있습니다.
이것이 내가 생각하는 것입니다 (잘못되면 수정하십시오!)
- 분산이 알려진 경우 정상적인 통계 , 분산을 알 수없는 경우 분포를 따릅니다.
- CLT (Central Limit Theorem) : 표본 평균의 표본 추출 분포는 충분히 큰 대해 대략 정상입니다 ( 일 수 있고, 치우친 분포의 경우 최대 일 수 있음 ).
- - 분포는 자유도 정상으로 간주 될 수있다
다음과 같은 경우 -test를 사용합니다 .
- 모집단 정규 및 분산이 알려져 있음 (모든 표본 크기에 해당)
- 모집단 정규, 분산 불명 및 (CLT로 인해)
- 이항 분포, ,
다음과 같은 경우 -test를 사용합니다 .
- 모집단 정규, 분산 알 수 없음 및
- 모집단 또는 분산에 대한 지식이없고 이지만 표본 데이터가 정상으로 보이거나 테스트를 통과하여 모집단이 정상으로 가정 될 수 있음
그래서 나는 남았습니다.
- 및 (?)의 표본의 경우 모집단 및 분산에 대한 지식이 알려지지 않았습니다.
그래서 내 질문은 :
표본 분포가 비정규 적으로 보일 때 평균의 표본 분포가 정규적이라고 (즉, CLT가 시작된) 어떤 표본 크기 (집단 분포 또는 분산에 대한 지식이없는 곳)를 가정 할 수 있습니까? 일부 배포판에는 필요 하지만 일부 리소스는 n > 30 일 때마다 -test를 사용하는 것으로 보입니다 ...
확실하지 않은 경우 데이터의 정규성을 확인한다고 가정합니다. 이제 표본 데이터가 정상으로 보이는 경우 검정을 사용합니까 (모집이 정상이라고 가정하고 n > 30 이래 )?
확실하지 않은 사례의 표본 데이터가 정상적으로 보이지 않는 경우는 어떻습니까? -test 또는 z - test를 계속 사용 하거나 비모수 적 테스트를 항상 변형 / 사용하려고하는 상황이 있습니까? CLT로 인해 n 의 일부 값 에서 평균의 샘플링 분포가 정상에 근사하지만 샘플 데이터는 해당 n의 값이 무엇인지 알려주지 않습니다 . 샘플 데이터는 비정규 일 수 있지만 샘플 평균은 normal / 따릅니다 . 실제로 평균의 샘플링 분포가 정상 / 이지만 알 수없는 경우 비모수 적 테스트를 변형 / 사용하는 경우가 있습니까?