왼쪽으로 치우 치거나 대칭 분포가 관찰 됨


10

이것은 설명하기가 어렵지만 문제를 이해할 수 있도록 노력하겠습니다. 먼저 지금까지 매우 간단한 선형 회귀 분석을 수행했음을 알아야합니다. 계수를 추정하기 전에 분포를 관찰했습니다 . 왼쪽으로 치우칩니다. 모델을 추정 한 후 QQ-Plot에서 왼쪽으로 치우친 잔차를 잘 보았지만 절대 그렇지 않았습니다. 이 솔루션의 이유는 무엇입니까? 실수는 어디입니까? 아니면 분포 가 오차항의 분포와 무관합니까?yy


@Aniko는 준다 좋은 대답을 이전 질문에 대한 응답.
whuber

답변:


22

질문에 대답하기 위해 매우 간단한 예를 들어 봅시다. 단순 회귀 모델은 . 여기서 입니다. 이제 가 이분법 이라고 가정합니다 . 경우 0이 아닌 다음의 분포 정상 않겠지 실제로 두 개의 정규 분포, 평균 한 혼합물 하고 평균 한 .yi=β0+β1xi+ϵiϵiN(0,σ2)xiβ1yiβ0β0+β1

경우 충분한이며 다음의 히스토그램 작은 정도로되어 쌍봉 보이는 것입니다. 그러나 "단일"기울어 진 분포처럼 보이는 의 히스토그램을 얻을 수도 있습니다 . 다음은 한 가지 예입니다 (R 사용).β1σ2yiyi

xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)

중요한 것은 의 분포가 아니라 오류 항의 분포입니다.yi

res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))

그리고 그것은 비 유적으로 말하면 =)


"그러나 오류 항의 분포"여기서 오류 항이 아닌 잔차를 의미합니까? 잔차 대 오류에 대한 자세한 내용 : stats.stackexchange.com/questions/133389/…
vasili111

7

@Wolfgang의 탁월한 답변과 관련하여 R 코드의 플롯은 다음과 같습니다.

여기에 이미지 설명을 입력하십시오

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.