혼합 효과 모델이 종속성을 해결하는 이유는 무엇입니까?


14

학생 시험 성적이 해당 학생이 공부하는 시간의 수에 어떻게 영향을 받는지 관심이 있다고 가정 해 봅시다. 이 관계를 탐색하기 위해 다음 선형 회귀 분석을 실행할 수 있습니다.

exam.gradesi=a+β1×hours.studiedi+ei

그러나 여러 학교에서 학생들을 채취하면 같은 학교의 학생들이 다른 학교의 학생들보다 서로 더 유사 할 것으로 예상 할 수 있습니다. 이 의존성 문제를 해결하기 위해 많은 교과서 / 웹에서 조언은 혼합 효과를 실행하고 무작위 효과로 학교에 들어가는 것입니다. 따라서 모델은 다음과 같습니다. 그러나 이것이 선형 회귀에 존재했던 의존성 문제를 해결하는 이유는 무엇입니까?

exam.gradesi=a+β1×hours.studiedi+schoolj+ei

12 살짜리와 대화하는 것처럼 응답하십시오


의존성 문제를 "해결"하는지 여부는 상황에 따라 다릅니다. 그러나 이제 확장 모델에는 특정 학교와 관련된 효과를 적어도 부분적으로 설명 할 수있는 용어가 있음을 알 수 있습니다.
image_doctor

답변:


23

모형에 임의의 항을 포함 시키면 성적간에 공분산 구조를 유도 할 수 있습니다. 학교의 무작위 요인은 같은 학교의 다른 학생들 사이에 0이 아닌 공분산을 유발하지만 학교가 다른 경우 입니다.0

하자는 모델 쓰기 인덱스 학교와 (각 학교에서) 학생들 인덱스를. 용어 학교 (A)에 그려진 독립적 랜덤 변수 N ( 0 , τ ) . 전자 , I는 (A)에 그려진 독립적 랜덤 변수 N ( 0 , σ

Ys,i=α+hourss,iβ+schools+es,i
sischoolsN(0,τ)es,i .N(0,σ2)

이 벡터는 예상 값

[α+hourss,iβ]s,i

Ys,iYs,i0ss

Ys,iYs,iτiiYs,iτ+σ2

예제 및 시뮬레이션 된 데이터

다음은 5 개 학교에서 온 50 명의 학생들을위한 짧은 R 시뮬레이션입니다 (여기서 나는 취합니다)σ2=τ=1

set.seed(1)
school        <- rep(1:5, each=10)
school_effect <- rnorm(5)

school_effect_by_ind <- rep(school_effect, each=10)
individual_effect    <- rnorm(50)

schools+es,i

plot(individual_effect + school_effect_by_ind, col=school, pch=19, 
     xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)

혼합 모델

schoolsα+hoursβ

이 예제의 분산 행렬

schoolses,i

[A00000A00000A00000A00000A]
10×10A
A=[2111111111121111111111211111111112111111111121111111111211111111112111111111121111111111211111111112].

1
엘비스 : 아마 나보다 통계에 정통한 사람들에게는 좋은 대답 일 것입니다. 12 세가 이해할 수있는 방식으로 응답을 편집 할 수 있습니까?
luciano

1
A .. 12 살?! 와! 이것이 도움이된다면 시뮬레이션을 추가 할 것입니다.
Elvis

5
끝난. 도움이 되었기를 바랍니다. 그렇지 않은 경우 얻지 못한 것에 대해 더 구체적으로 설명하십시오. 12 yo도 질문을 이해하지 못할 것입니다 ... 질문보다 간단한 답변을 요청할 수 없습니다.
Elvis
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.