4-5 개의 설명 변수를 사용하여 회귀 분석을 실행하려고하지만 15 개의 관측치 만 있습니다. 이러한 변수가 정규 분포를 따른다고 가정 할 수없는 경우 비모수 적이거나 다른 유효한 회귀 방법이 있습니까?
4-5 개의 설명 변수를 사용하여 회귀 분석을 실행하려고하지만 15 개의 관측치 만 있습니다. 이러한 변수가 정규 분포를 따른다고 가정 할 수없는 경우 비모수 적이거나 다른 유효한 회귀 방법이 있습니까?
답변:
@Glen_b는 회귀 분석 1 의 정규성 가정의 본질에 관한 것입니다 .
더 큰 문제는 4-5 개의 설명 변수를 지원하기에 충분한 데이터가 없다는 것입니다. 경험 법 2 의 표준 규칙은 설명 변수 당 최소 10 개의 데이터, 즉 귀하의 경우 40 또는 50 개의 데이터를 가져야한다는 것입니다 (이는 가정에 대한 의문이없는 이상적인 상황에 대한 것입니다). 모델이 완전히 포화되지 않았기 때문에 3(적합 할 수있는 모수보다 많은 데이터가 있음) 모수 (기울기 등) 추정값을 얻을 수 있으며 이상적인 상황에서는 추정치가 무의식적으로 편향되지 않습니다. 그러나 추정치가 실제 값에서 멀리 떨어져 있고 SE / CI가 매우 클 가능성이 높으므로 통계적 힘이 없습니다. 비모수 또는 다른 대안의 회귀 분석을 사용해도이 문제에서 벗어날 수는 없습니다.
여기서해야 할 일은 해당 분야의 이전 이론이나 직감을 기반으로 단일 설명 변수 (데이터를보기 전에!)를 선택하거나 설명 변수를 결합해야합니다. 후자의 옵션에 대한 합리적인 전략은 주성분 분석 (PCA) 을 실행 하고 첫 번째 주성분을 설명 변수로 사용하는 것입니다.
참조 :
1. 잔차가 정규 분포를 따르지만 Y가 분포되지 않은 경우 어떻게해야합니까?
2. 다중 회귀 분석을위한 최소 표본 크기에 대한 경험 법칙
3. 다중 회귀 방정식에 입력 할 수있는 최대 독립 변수 수