랜덤 효과가 0으로 줄어드는 이유는 무엇입니까?


10

랜덤 선형 효과가 일반 선형 혼합 모형에서 예상 값으로 축소되는 직관적 인 이유가 있습니까?


이 질문에 대한 추가 컨텍스트를 제공해 주시겠습니까?
매크로

랜덤 효과 모델에서 예측 된 값은 수축 추정기입니다 . 통계 단위가 다르거 나 측정이 정확하거나 샘플이 클 경우 수축이 거의 없습니다. 이것이 당신이 추구하는 것입니까, 아니면 실제로 기대 가치에 대한 축소를 의미합니까?
chl

3
필자는 Stein 's Paradox in Statistics (1977)의 Bradley Efron과 Carl Morris의 오래된 기사를 제안합니다 (온라인 PDF는 여기에 있습니다 ). 그것이 직관적인지 확실하지 않지만 수축 개념에 대한 실제 사례와 함께 아주 온화한 소개입니다.
앤디 W

답변:


4

일반적으로 말하면, 대부분의 "랜덤 효과"는 "고정 효과"또는 모델의 다른 부분이있는 상황에서 발생합니다. 일반적인 선형 혼합 모델은 다음과 같습니다.

yi=xiTβ+ziTu+ϵi

여기서 는 "고정 효과"이고 는 "무작위 효과"입니다. 분명히 구별은 개념적 수준이거나 와 의 추정 방법에만있을 수 있습니다 . I 새로운 "고정 효과"를 정의하면 들어 및 그때 평범한 선형 회귀가 있습니다.βuuβx~i=(xiT,ziT)Tβ~=(βT,uT)T

yi=x~iTβ~+ϵi

기본 개념 목표가 명확하지 않은 경우 혼합 모델을 적합하게 만들 때 종종 실제적인 문제입니다. 무작위 효과 0 으로 줄어들었고 고정 효과 여기에 도움 이되지 않는다는 사실을 생각합니다 . 우리가 단지와 모델을 선호하는 경향이 있음이 수단 포함 (예 : 의 추정) OLS 배합 낮은 정밀도를 가지고 있고, 추정 전체 OLS 제제를 선호하는 경향이 높은 정밀도를 가지고 있습니다.u β βu=0uu


2

귀하의 질문에 스스로 대답하지 않습니까? 값이 예상되면 값에 더 가까운 기술이 가장 좋습니다.

간단한 답변은 많은 수의 법칙에서 비롯됩니다. 주제가 무작위 효과라고 가정 해 봅시다. 200 번의 시험에서 A부터 D까지, 20 번의 시험에서 E에서 피험자를 측정한다면, 피험자의 측정 된 평균 성능 중 어느 것이 mu를 대표한다고 생각하십니까? 많은 수의 법칙에 따르면 주제 E의 성과가 A에서 D까지보다 mu에서 더 많이 벗어날 가능성이 더 높을 것으로 예측할 수 있습니다. 그렇지 않을 수도 있고 어떤 주제도 벗어날 수 있지만 훨씬 더 많을 것입니다 다른 방법보다 피사체 A에서 D에 대한 피사체 E의 효과를 줄이는 데 정당화됩니다. 따라서 더 크고 N이 작은 랜덤 효과는 가장 많이 줄어드는 경향이 있습니다.

이 설명에서 고정 효과가 축소되지 않는 이유도 있습니다. 그것들은 고정되어 있기 때문에 모델에는 하나뿐입니다. 당신은 그것을 축소 할 참조가 없습니다. 기울기로 0을 사용할 수는 있지만 임의의 효과가 줄어드는 것은 아닙니다. 그들은 mu와 같은 전반적인 추정을 향하고 있습니다. 모형에서 얻은 고정 효과는 추정치입니다.


1

혼합 모델을 계층 또는 다중 레벨 모델 로 생각하는 것이 직관에 도움이 될 것이라고 생각합니다 . 적어도 나에게 중첩을 생각할 때와 모델이 계층 내에서 그리고 계층 적으로 어떻게 작동하는지 생각할 때 더 의미가 있습니다.

편집 : 매크로, 나는 이것을 좀 더 직관적으로 볼 수 있기 때문에 약간 개방형으로 남겨 두었지만 정확하지는 않습니다. 그러나 잘못된 방향으로 확장하려면 ...

나는 범주별로 평균화 된 고정 효과와 범주를 구별하는 임의의 효과로 간주합니다. 어떤 의미에서, 랜덤 효과는 일부 특성을 공유하는 "클러스터"이며, 더 크고 작은 클러스터는 평균보다 높은 수준에서 더 큰 영향을 미칩니다.

OLS가 피팅을 수행함에 따라 (단계에서는 필자가 생각하는) 더 크고 더 작은 랜덤 효과 "클러스터"가 자신에게 더 적합하게 밀리는 반면, 더 작거나 확산 된 "클러스터"는 피팅을 덜 끌어 당길 것입니다. 또는 높은 수준의 평균은

더 명확하지 않아서 잘못되었을 수도 있습니다. 직관적으로 이해가되지만 작성하려고 할 때 하향식 또는 상향식인지 또는 다른 것이 확실하지 않습니다. 낮은 수준의 "클러스터"풀링이 더 강력 해 지거나 높은 수준의 평균화에 더 큰 영향을 미치므로 높은 수준의 평균에 가까운 "종료"되는 문제입니까?

어느 경우이든, 더 작고 더 분산 된 랜덤 변수 범주가 더 크고 더 작은 범주보다 평균을 향해 더 멀리 당겨지는 이유를 설명한다고 생각합니다.


안녕 웨인, 당신은 이것을 계층 적 모델로 생각함으로써 수축이 (아마도 더 직관적으로) 개념화 될 수있는 방법을 설명하기 위해 이것을 확장 할 수 있습니까?
Macro

@ 매크로 : 좋아, 나는 그것을 시도했다. 그래도 대답이 나아지는지 확실하지 않습니다.
Wayne
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.