267

간단히 말해서 고정 효과, 임의 효과 및 혼합 효과 모델의 차이점을 어떻게 설명합니까 (단순한 예일 경우)?

— 앤드류
소스

3

또한 효과가 고정 또는 임의 효과로 간주되어야하는 시점을 결정하기가 어려운 경우도 있습니다. 이 사실에 대한 몇 가지 권장 사항이 있지만 올바른 결정을 내리는 것이 항상 쉬운 것은 아닙니다.

— Manuel Ramón

3

이 링크는 고정, 랜덤, 혼합 모델 (SAS 문서) 혼합 모델 의 기본 원칙을 명확하게 설명하는 데 도움이 될 수 있습니다 .

— pietrop

6

여기에서 매우 유용한 답변을 찾을 수 있습니다. 랜덤 효과, 혼합 효과 및 한계 모델의 차이점은 무엇입니까?

— gung

145

통계 학자 앤드류 겔먼 (Andrew Gelman) 은 '고정 효과'와 '무작위 효과'라는 용어 는 누가 그것을 사용하는지에 따라 다양한 의미를 가진다고 말합니다 . 아마도 5 가지 정의 중 하나를 귀하의 사례에 적용 할 수 있습니다. 일반적으로 저자가 사용하고있는 확률 모델을 설명하는 수식을 찾거나 (읽을 때) 사용하려는 전체 확률 모델을 작성하는 방법 (쓰기시)을 사용하는 것이 좋습니다.

여기에 우리가 본 다섯 가지 정의가 있습니다 :

고정 효과는 개인마다 일정하며 무작위 효과는 다양합니다. 예를 들어, 성장 연구에서 랜덤 절편 및 고정 기울기 가진 모델 은 다른 개인 평행선 또는 모델에 해당합니다 . Kreft와 De Leeuw (1998)는 고정 계수와 랜덤 계수를 구분합니다. $a_i$ $b$ $i$ $y_{it} = a_i + b t$

그 자체로 흥미가 있거나 기본 인구에 관심이 있다면 무작위로 효과가 고정됩니다. Searle, Casella 및 McCulloch (1992, 1.4 절)는이 차이점에 대해 깊이 탐구합니다.

“표본이 모집단을 소진하면 해당 변수가 고정됩니다. 표본이 모집단의 작은 (즉, 무시할만한) 부분 인 경우 해당 변수는 임의적입니다.”(Green and Tukey, 1960)

"효과가 랜덤 변수의 실현 된 값이라고 가정하면 랜덤 효과라고합니다."(LaMotte, 1983)

고정 효과는 최소 제곱 (또는 일반적으로 최대 가능성)을 사용하여 추정하고 무작위 효과는 축소를 통해 추정됩니다 (1991 년 Robinson 용어에서 "선형 비 편향 예측"). 이 정의는 다단계 모델링 문헌 (예 : Snijders and Bosker, 1999, 섹션 4.2 참조)과 계량 경제학에서 표준입니다.

[ Gelman, 2004, 분산 분석 – 왜 그 어느 때보 다 중요한가. 통계의 연대기. ]

— 존 살 바티에
소스

4

+1 : 아주 좋은 링크! 그 정의는 또한 분야에 따라 다르다고 생각합니다 (예 : # 4는 매우 수학 / 통계적이지만 # 1과 # 2는 생명 과학의 관점에서 더 "이해할 수 있습니다")

— nico

12

또한이 논문에 대한 토론과 의견을 읽는 것도 유익하다. 토론에서 Peter McCullagh는 Gelman이 쓴 내용의 상당 부분에 동의하지 않는다고 썼습니다. 저의 요점은 둘 중 하나를 선호하는 것이 아니라 전문가들 사이에 상당한 의견 차이가 있으며 한 종이에 너무 많은 무게를 두지 않는 것입니다.

— Julieth

6

전체 토론은 링크에 있습니다

— Julieth

36

Andrew Gelman이 오늘날 세계 최고의 통계 학자 중 하나가 아니라 "블로거"로 묘사되어 있다는 것은 재밌습니다. 물론 블로거이지만 자격을 갖춘 사람은 아마도 통계 학자 앤드류 겔먼 (Andrew Gelman)이라고 불릴 것입니다.

— Brash Equilibrium

4

그러나 단순한 블로거가 아니라 통계 학자로서 그는 5 가지 경우에 대해 적어도 주관적인 상대 빈도를 설정해야했습니다. 사람들이 고정 효과 대 임의 효과에 대해 이야기 할 때 대부분의 경우 다음을 의미합니다.

(4) “If an effect is assumed to be a realized value of a random variable, it is called a random effect.” (LaMotte, 1983)

— Ufos

251

Gelman과 Hill과 같은 좋은 책들이 있습니다 . 다음은 본질적으로 그들의 관점에 대한 요약입니다.

우선, 용어에 너무 익숙해 져서는 안됩니다. 통계에서 전문 용어는 모델 자체에 대한 수학적 이해를 대신 할 수 없습니다. 랜덤 및 혼합 효과 모델의 경우 특히 그렇습니다. "혼합"은 모델에 고정 효과와 임의 효과가 모두 있음을 의미하므로 고정 효과와 임의 효과의 차이에 중점을 두겠습니다.

랜덤 대 고정 효과

범주 값에 따라 관측치를 그룹으로 나누는 범주 형 예측 변수가있는 모형이 있다고 가정 해 봅시다. * 해당 예측 변수와 관련된 모형 계수 또는 "효과"는 고정적이거나 무작위 일 수 있습니다. 둘 사이의 가장 중요한 실제 차이점은 다음과 같습니다.

랜덤 효과는 부분 풀링으로 추정되지만 고정 효과는 그렇지 않습니다.

부분 풀링은 그룹에 데이터 포인트가 거의없는 경우 그룹의 효과 추정치가 다른 그룹의 더 풍부한 데이터를 부분적으로 기반으로한다는 것을 의미합니다. 이는 모든 그룹을 완전히 풀링하여 그룹 수준의 변동을 가릴 수있는 효과를 추정하고 모든 그룹에 대한 효과를 완전히 개별적으로 추정하여 효과를 추정하는 것 사이의 절충이 될 수 있습니다.

랜덤 효과는 단순히 범용 통계 모델로서 부분 풀링 기술의 확장입니다. 이를 통해 여러 예측 변수, 혼합 된 연속 및 범주 형 변수 및 복잡한 상관 관계 구조를 포함한 다양한 상황에 아이디어를 원칙적으로 적용 할 수 있습니다. (그러나 강력한 힘을 가진 것은 큰 책임이 따른다. 모델링과 추론의 복잡성이 크게 증가 하고 피해야 할 상당한 정교함을 요구 하는 미묘한 편견 이 생길 수있다.)

랜덤 효과 모델에 동기를 부여하기 위해 스스로에게 물으십시오. 왜 부분 풀을 하시겠습니까? 작은 하위 그룹이 일반적인 평균 효과를 가진 더 큰 그룹의 일부라고 생각하기 때문일 수 있습니다. 부분 군 평균은 큰 그룹 평균에서 약간 벗어날 수 있지만 임의의 양 만큼은 아닙니다. 이 아이디어를 공식화하기 위해 편차는 일반적으로 가우시안 분포를 따릅니다. 여기에서 랜덤 효과의 "임의"가 발생합니다. 우리는 부모로부터의 하위 그룹의 편차가 랜덤 변수의 분포를 따른다고 가정합니다. 일단이 아이디어를 염두에두면 혼합 효과 모델 방정식이 자연스럽게 따릅니다.

불행하게도, 혼합 효과 모델 사용자는 임의 효과와 고정 효과와의 차이점에 대해 잘못된 선입견을 가지고 있습니다. 사람들은 "무작위"를 듣고 어떤 것이 "무작위로 샘플링"될 때 임의의 효과가 사용되어야하는 반면 고정 된 효과는 무언가가 "고정"될 때 사용되어야하는 것과 같이 모델링되는 시스템에 대해 매우 특별한 무언가를 의미한다고 생각합니다. 그러나 모델 계수가 분포에서 나온다고 가정 할 때 특히 랜덤 한 것은 없습니다. 능선 회귀 모델 계수에 적용되는 페널티 와 유사한 부드러운 제약 조건 입니다. 임의의 효과를 사용하거나 사용하지 않으려는 상황이 많이 있으며 "고정"과 "무작위"의 구분과 관련이있는 것은 아닙니다. $\ell_2$

불행하게도,이 용어들에 의해 야기 된 개념 혼동 은 상충되는 정의의 확산으로 이어졌다 . 이 링크의 다섯 가지 정의 중 일반적인 경우에는 # 4 만 완전히 맞지만 완전히 정보가 없습니다. 그 정의가 실제 작업에서 의미하는 바를 이해하려면 전체 논문과 책을 읽거나이 게시물을 읽지 않아야합니다.

예

랜덤 효과 모델링이 유용한 경우를 살펴 보겠습니다. 우편 번호로 평균 미국 가구 소득을 추정한다고 가정하십시오. 가구 소득 및 우편 번호에 대한 관찰이 포함 된 대규모 데이터 세트가 있습니다. 일부 우편 번호는 데이터 세트에 잘 표시되어 있지만 다른 우편 번호는 몇 세대뿐입니다.

초기 모델의 경우 대부분의 ZIP에서 평균 수입을 얻습니다. ZIP에 대한 데이터가 많을 때 잘 작동하지만 샘플링이 잘못된 ZIP에 대한 추정치에는 편차가 커집니다. 수축 추정기 (일명 부분 풀링)를 사용하여이를 완화 할 수 있습니다. 이는 모든 우편 번호의 평균 수입으로 극단적 인 가치를 제공합니다.

그러나 특정 ZIP에 대해 얼마나 많은 수축 / 풀링을 수행해야합니까? 직관적으로 다음에 의존해야합니다.

그 ZIP에 몇 개의 관측치가 있습니까?
전체적으로 몇 개의 관측치가 있습니까?
모든 우편 번호 의 개인 수준 평균 및 가계 수입 변동
모든 우편 번호에 걸친 평균 가계 수입 의 그룹 수준 차이

우편 번호를 임의의 효과로 모델링하는 경우 모든 우편 번호의 평균 수입 추정치에는 위의 모든 요소를 고려하여 통계적으로 잘 알려진 축소가 적용됩니다.

가장 좋은 부분은 랜덤 및 혼합 효과 모델이 모델의 모든 랜덤 효과에 대해 변동성 추정치 인 (4)를 자동으로 처리한다는 것입니다. 이것은 한눈에보기보다 어렵습니다. 각 ZIP에 대해 표본 평균의 분산을 시도 할 수 있지만, 다른 ZIP에 대한 추정값 간의 분산 중 일부는 샘플링 분산이기 때문에 이것은 편향되어 있습니다. 랜덤 효과 모델에서 추론 프로세스는 표본 추출 분산을 설명하고 그에 따라 분산 추정값을 축소합니다.

(1)-(4)를 고려한 랜덤 / 혼합 효과 모델은 저 표본 그룹에 대한 적절한 수축을 결정할 수 있습니다. 또한 다양한 예측 변수가있는 훨씬 복잡한 모델을 처리 할 수 있습니다.

계층 적 베이지안 모델링과의 관계

이것이 계층 적 베이지안 모델링처럼 들리면, 당신이 옳습니다. 가까운 친척이지만 동일하지는 않습니다. 혼합 효과 모델은 잠재적이고 관찰되지 않은 매개 변수에 대한 분포를 표시한다는 점에서 계층 적이지만 최상위 하이퍼 파라미터에 적절한 사전이 주어지지 않기 때문에 일반적으로 완전히 베이지안이 아닙니다. 예를 들어, 위의 예에서 우리는 주어진 ZIP의 평균 수입을 정규 분포의 표본으로 취급 할 것입니다. 혼합 효과 피팅 프로세스에 의해 알 수없는 평균과 시그마가 추정됩니다. 그러나 (베이지안이 아닌) 혼합 효과 모델은 일반적으로 알 수없는 평균 및 시그마에 대한 사전을 가지지 않으므로 완전히 베이지안이 아닙니다. 그러나 적당한 크기의 데이터 세트를 사용하면 표준 혼합 효과 모델과 완전 베이지안 변형이 종종 매우 유사한 결과를 제공합니다.

*이 주제에 대한 많은 치료가 "그룹"의 좁은 정의에 초점을 맞추고 있지만 개념은 실제로 매우 유연합니다. 이는 공통된 속성을 공유하는 일련의 관측 일뿐입니다. 그룹은 한 사람 또는 여러 학교의 여러 사람들, 또는 한 학군의 여러 학교, 또는 단일 종류의 과일 또는 여러 종류의 같은 수확에서 얻은 여러 종류의 채소 또는 여러 수확에 대한 여러 관찰로 구성 될 수 있습니다 같은 범주의 야채 등을 포함합니다. 범주 형 변수는 그룹화 변수로 사용할 수 있습니다.

— 폴
소스

19

+6. 나는 이것이 이것이이 스레드에서 가장 좋은 대답이라고 생각하며 시간이 지남에 따라 그것이 가장 많이 찬성 될 것입니다. 내가 제안 할 한 가지 제안은 몇 가지 공식을 포함시키는 것입니다. 예제 섹션에서 고정 및 임의 효과 모델 (및 "단일 계수"모델, 즉 "완전한 풀링"을 지정하는 공식을 제공 할 수 있습니다) "). 나는 공식이 당신의 대답을보다 명확하고 매력적이며 매력적으로 보이게 할 것이라고 생각합니다 (현재는 텍스트 벽과 약간 비슷합니다).

— amoeba

3

@amoeba 감사합니다! 계수가 잘못된 단어라는 것이 맞습니다. 계수보다 "모델 용어"와 비슷합니다. 수식은이 질문과 다른 질문을 해결하는 데 도움이됩니다. 나는 시간과 영감에 부딪 치면서이 답변을 천천히 조정 해 왔으며, 그것이 필요한 곳이 될 때까지 계속 그렇게 할 것입니다! 아마 "단일 범주 형 변수에 대한 회귀"에 대한 공식을 구체화 할 것입니다. 전체 풀링 = 그룹 계수가 동일 (델타 사전, 제로 시그마), 부분 풀링 = 비트 (유한 시그마), 풀링 없음 = 제약 없음 (무한 시그마)이 다를 수 있습니다.

— Paul

큰 답변 주셔서 감사합니다! 그러나 "당신은 축소 견적 (일부 풀링)을 사용하여이를 완화 할 수 있습니다. 이것은 모든 우편 번호의 평균 수입으로 극단적 인 가치를 제공 할 것입니다." 부분 풀링이란 무엇입니까? 직관적 인 예를 들어 주시겠습니까? 또한, 랜덤 효과에 관한 Wikipedia 페이지 는 내가 말한 것과 어떻게 일치합니까? "무작위 효과"에 대한 예제는 샘플 크기를 전혀 고려하지 않습니다.

— AlphaOmega

2

이 답변에 대한 100 개의 투표를 통과 한 것을 축하합니다 :-)

— amoeba

1

@Paul이 답변을 병합하는 방법을 이해하는 데 정말 어려움을 겪고 있습니다 (예 : "사람 ... 생각 ... 고정 된 효과는 무언가를"고정 "할 때 사용해야하고 임의의 효과는 무작위로 샘플링해야 할 때 사용됩니다 ") 표준 오류가 혼합 모델에서 나타나는 방식으로 무작위 효과를 가진 SE가 무작위로 샘플링되었다는 가정과 일치하는 것처럼 보이며 고정 효과가있는 경우에만 고정 효과가있는 SE와 일치하는 것처럼 보입니다. . 예를 들어, 참조 여기에 ?. 말을 넘어 감사 어떤 생각 무엇 내가 놓친 거지!

— justme

47

나는 혼합 모델에 대한 책 장에서 이것에 대해 썼다 ( Fox, Negrete-Yankelevich, Sosa 2014의 13 장 ). 관련 페이지 (311-315 페이지)는 Google 도서에서 볼 수 있습니다 . 나는 그 질문이 "고정 효과와 무작위 효과의 정의는 무엇인가?" "혼합 모델"은 둘 다를 포함하는 모델 일뿐입니다. 내 토론은 공식적인 정의 (위의 @ JohnSalvatier의 답변으로 연결된 Gelman 논문을 참조)에 대해 조금 덜하고 실제 속성과 유틸리티에 대해 더 많이 설명합니다. 다음은 몇 가지 발췌문입니다.

랜덤 효과에 대한 전통적인 관점은 일부 관측치가 서로 연관되어있을 때 정확한 통계 테스트를 수행하는 방법입니다.

또한 랜덤 효과를 그룹화 변수 내에서 다른 수준의 정보를 결합하는 방법으로 생각할 수 있습니다.

랜덤 효과는 (1) 많은 레벨 (예 : 많은 종 또는 블록), (2) 각 레벨에 대해 상대적으로 적은 데이터 (대부분의 레벨에서 여러 샘플이 필요하지만), (3) 고르지 않은 경우 특히 유용합니다. 레벨에 따른 샘플링 (박스 13.1).

상용 주의자와 베이지안은 임의의 효과를 다소 다르게 정의하여 사용 방식에 영향을줍니다. 상용 주의자들은 무작위 효과를 더 큰 집단에서 무작위 로 선택한 수준의 범주 형 변수로 정의합니다.예를 들어, 고유종 목록에서 무작위로 선택된 종. 베이지안은 랜덤 효과를 [모두] 같은 분포에서 추출한 변수 세트로 정의합니다. 잦은 정의는 철학적으로 일관성이 있으며이를 주장하는 연구자 (검토 자 및 감독자 포함)를 만날 수 있지만 실제로 문제가 될 수 있습니다. 예를 들어, 종 목록이 더 많은 개체군의 표본이 아니므로 연도를 임의의 효과로 사용하기 때문에 현장에서 모든 종을 관찰 한 경우 종을 무작위 효과로 사용할 수 없습니다. 연구자들은 무작위로 표본 추출 된 해에 실험을하는 경우가 거의 없기 때문에 대개 연속 된 연속 연도 또는 현장에 들어갈 수있는 우연한 해를 사용합니다.

임의 효과는 특정 수준 간의 값 차이를 테스트하는 대신 값 분포 (즉, 다른 수준의 반응 값 사이의 편차)에 대해 추론하는 데 관심이있는 예측 변수로 설명 할 수도 있습니다.

사람들은 때때로 임의의 효과가“관심이없는 요소”라고 말합니다. 항상 그런 것은 아닙니다. 생태 실험 (사이트 간 변동이 대개 성가신 경우) 인 경우가 많지만, 예를 들어 유전자형 간 변동이 자연 선택을위한 원료 인 진화 연구 또는 인구 통계 연구에서 종종 큰 관심을 끌고 있습니다. 매년 변동이 장기 성장률을 낮추는 곳. 어떤 경우에는 고정 된 효과를 사용하여 무관심한 변화를 제어하는데, 예를 들어 질량을 공변량으로 사용하여 신체 크기의 효과를 제어합니다.

또한 "조건부 모드의 (예측 된) 값에 대해 아무 말도 할 수 없습니다."라는 말을들을 수 있습니다. 이는 사실이 아닙니다. 값이 0인지, 아니면 0인지에 대한 귀무 가설을 공식적으로 테스트 할 수 없습니다. 서로 다른 두 수준의 값은 동일하지만 예측 된 값을보고 예측 된 값의 표준 오차를 계산하는 것조차 여전히 완벽하게 합리적입니다 (예 : 그림 13.1의 조건부 모드 주변의 오차 막대 참조).

$\textrm{species_mean} \sim {\cal N}(\textrm{genus_mean}, \sigma^2_{\textrm{species}})$

나는 그룹화 변수가 많은 측정 수준을 가질 때 임의의 효과가 가장 유용하다고 위에서 말했다. 반대로 그룹화 변수의 수준이 너무 낮은 경우 무작위 효과는 일반적으로 효과가 없습니다. 그룹화 변수의 수준이 5 개 미만인 경우 일반적으로 임의 효과를 사용할 수 없으며, 매우 작은 표본에서 분산을 추정하려고하기 때문에 임의 효과 분산 추정값이 8 개 미만의 수준에서는 불안정합니다.

— 벤 볼커
소스

미리보기는 현재 ... (311) 이후에는 페이지를 보여주지 않습니다, 그리고 여기에 매우 유용 할 것 같아 페이지 (310)를 그리워

— 파리

아마도 지역 문제일까요? 어쨌든 위의 명확한 답변에 감사드립니다!

— 비행

1

또한 Google 도서 검색 결과에 액세스 할 수 없습니다. 여기에 텍스트를 포함시켜 주셔서 감사합니다.

— MichaelChirico

나는이 발췌문을 정말 좋아한다. 이것은 내가 본 임의의 효과를 언제, 왜 사용해야하는지에 대한 가장 명확하고 유용한 설명 일 것입니다. 몇 년 전에 가르쳤을 때 나는 그것을 간절히 바랍니다.

— Gregor

39

고정 효과 : 실험자가 직접 조작하고 종종 반복 할 수있는 것 (예 : 약물 투여-한 그룹은 약물을, 한 그룹은 위약을 얻습니다).

무작위 효과 : 무작위 변이 원 / 실험 단위, 예를 들어, 임상 시험을 위해 모집단에서 (무작위로 추첨 된) 개인. 랜덤 효과는 변동성을 추정합니다

혼합 효과 :이 경우 고정 효과는 모집단 수준 계수를 추정하는 반면, 임의 효과는 효과에 대한 반응으로 개인차를 설명 할 수 있습니다. 예를 들어, 각 경우마다 다른 경우에 약물과 위약을받는 효과는 약물의 효과를 추정하며, 임의의 효과 조건은 각 사람이 약물에 다르게 반응 할 수 있도록합니다.

혼합 효과의 일반적인 범주-반복 측정, 세로, 계층, 분할 플롯.

— 맷 알브레히트
소스

3

당신의 잘못은 아니지만 고정 효과가 무엇인지에 대한 정의는 누군가가 고정 효과를 말할 때 내가 생각하는 것이 아닙니다. 여기에 누군가가 고정 된 효과라고 할 때의 생각이다 en.wikipedia.org/wiki/Difference_in_differences , 또는이 stata.com/support/faqs/stat/xtreg2.html 합니다 (STATA 페이지에 특히 방정식 3)

— 앤디 W

@AndyW : "고정 효과"가 무엇인지에 대한 이해가 Gelman이 나열하고 JohnSalvatier의 (허용 된) 답변에서 인용 한 정의 # 1에 해당한다는 것을 올바르게 이해하고 있습니까?

— amoeba

1

당신이 모델을 추정하지 않지만 - 대부분의 경제학자들은 내가 추측 할 고정 효과를 말할 때 생각하는 것이 무엇 실제로. 다른 매개 변수에 대한 편견없는 추정치를 얻기 위해 빼는 귀찮은 용어입니다. (이 빌어 먹을 모델을 작성하는 것은 부정확 한 전문 용어를 넘어가는 것보다 훨씬 간단합니다.)

a_{i}

$a_i$

— Andy W

1

@ 앤디 감사합니다. 내가 이해하는 한, 귀하의 설명은 생물 통계학 / 혼합 모델 전문 용어에 정확하게 맞으 므로이 경우 계량 경제학 / 생물 통계학 충돌이 보이지 않습니다. 적어 모델 의 항은 혼합 모델 용어에서 고정 효과로 간주됩니다. 여기에 주어진 "정의"는 전혀 도움이되지 않기 때문에 (이는 실제로 정의가 아니지만 임의의 사용시기와 특정 응용 분야에서 고정 효과를 사용하는시기를 결정하는 몇 가지 규칙이 있기 때문에 나는이 대답을 하향 조정했습니다. ).

a_{i}

$a_i$

— amoeba

1

@amoeba이 답변은 -1이어야합니다. 정확한 일반적인 설명을 제공하지 않으며이 특정 설명이 유효한 조건을 지정하지도 않습니다. 그렇다면 누가이 답을 발견하고 신뢰할 수 있고 유용한 지식을 얻을 수 있을까요?

— Paul

23

나는에서이 질문에 와서 여기에 , 가능한 중복.

이미 몇 가지 훌륭한 답변이 있지만 받아 들여진 답변에 언급 된 것처럼 용어에는 여러 가지 (그러나 관련 된) 용도가 있으므로 계량 분석에 채택 된 관점을 제시하는 것이 중요 할 수 있습니다. .

선형 패널 데이터 모델 인 소위 오류 구성 요소 모델)을 고려하십시오. 여기서 는 때때로 시간이 지남에 따라 일정한 오류 구성 요소 인 개별 별 이종이라고합니다. 다른 오류 구성 요소 는 "idiosyncratic"이며 단위와 시간에 따라 다릅니다.

y_{i t} = X_{i t} δ + α_{i} + η_{i t},

$y_{it}=X_{it}\delta+\alpha_i+\eta_{it},$

α_{i}

$\alpha_i$

η_{i t}

$\eta_{it}$

랜덤 효과 접근 방식을 사용하는 이유는 의 존재 가 "구형"이 아닌 오차 공분산 행렬 (여기서 항등 행렬의 배수는 을 초래하므로 임의 효과와 같은 GLS 유형 접근 방식은 OLS보다 더 효율적입니다). $\alpha_i$

그러나 가 회귀 와 상관 관계 가있는 경우, 많은 전형적인 응용에서와 같이 표준 교과서 (적어도 계량 경제학 교과서의 표준) 랜덤 효과 추정기의 일관성에 대한 기본 가정 중 하나입니다. , 즉. 이 위반되었습니다. 그런 다음 이러한 절편에 효과적으로 맞는 고정 효과 방식이 더 설득력이 있습니다. $\alpha_i$ $X_{it}$ $Cov(\alpha_i,X_{it})=0$

다음 그림은이 점을 설명하기위한 것입니다. 와 사이의 원시 상관 관계 는 양수입니다. 그러나, 하나 개의 단위 (색상)에 속하는 관측은 음의 관계를 전시 -이이 반응하기 때문에 우리가 확인하고자하는 것입니다 의 변화에 . $y$ $X$ $y_{it}$ $X_{it}$

또한, 와 사이에는 상관 관계가 있습니다. 전자가 개인별 인터셉트 인 경우 (즉, 때 단위 대한 예상 값 ), 예를 들어 하늘색 패널 장치는 갈색 장치보다 훨씬 작습니다. 동시에, 밝은 파란색 패널 단위는 훨씬 작은 회귀 값 갖 . $\alpha_i$ $X_{it}$ $i$ $X_{it}=0$ $X_{it}$

따라서 풀링 된 OLS는 여기서 잘못된 전략 일 것 입니다.이 추정기는 기본적으로 색상을 무시 하기 때문에 의 양의 추정값을 초래하기 때문입니다 . RE는 가중 버전의 FE와 사이의 "시간"-평균 을 서로 회귀하는 추정기 사이의 바이어스 입니다. 그러나 후자는 와 의 상관 관계가 필요하지 . $\delta$ $t$ $\alpha_i$ $X_{it}$

그러나이 편향 은 FE의 가중치가 1에 가까워 질수록 단위당 기간의 수 ( 아래 코드에서 )가 증가함에 따라 사라집니다 (예 : Hsiao, 패널 데이터 분석, 섹션 3.3.2 참조). $T$ m

다음은 데이터를 생성하고 양의 RE 추정값과 "올바른"음의 FE 추정값을 생성하는 코드입니다. (이에 따르면 RE 추정치는 종종 다른 종자에 대해서도 부정적 일 수있다 (위 참조).)

library(Jmisc)
library(plm)
library(RColorBrewer)
# FE illustration
set.seed(324)
m = 8
n = 12

step = 5
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
beta = -1
y = X = matrix(NA,nrow=m,ncol=n)
for (i in 1:n) {
  X[,i] = runif(m,i,i+1)
  X[,i] = rnorm(m,i)
  y[,i] = alpha[i] + X[,i]*beta + rnorm(m,sd=.75)  
}
stackX = as.vector(X)
stackY = as.vector(y)

darkcols <- brewer.pal(12, "Paired")
plot(stackX,stackY,col=rep(darkcols,each=m),pch=19)

unit = rep(1:n,each=m)
# first two columns are for plm to understand the panel structure
paneldata = data.frame(unit,rep(1:m,n),stackY,stackX) 
fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

출력 :

> fe

Model Formula: stackY ~ stackX

Coefficients:
 stackX 
-1.0451 


> re

Model Formula: stackY ~ stackX

Coefficients:
(Intercept)      stackX 
   18.34586     0.77031

— 크리스토프 행크
소스

1

는 무엇입니까

δ

$\delta$

— adam

1

또한이 예제를 혼합 효과로 처리하는 것이 가능하다는 것이 밝혀졌습니다. 다음과 같은 방법을 보여주는 논문이 있습니다 : collegecommons.columbia.edu/download/fedora_content/download/…

— Paul

1

마지막 요점에 대해서는 의심의 여지가 없습니다. 이전 의견을 참조하십시오. 마지막 두 번째 주석의 경우, 예, RE는 FE에 1의 가중치를 부여하고 추정기 사이에 0의 가중치를 로 제공하지만 증상은 일반적으로 대해 취 합니다. 참고로 편집 된 답변을 참조하십시오. 인터셉트에 대한 제어력 부족에 대한 나의 이야기가 실제로 풀링 된 OLS에 더 유용하다고 생각합니다.

T \to \infty

$T\to\infty$

N

$N$

— Christoph Hanck

7

전술 한 논의에서 "랜덤 효과"를 "R의 plm 패키지에 구현 된 제한된 랜덤 효과 버전"으로 대체하는 것이 더 정확할 것이다. 이전 의견에서 인용 한 논문에서와 같이 상관 예측 변수 / 그룹 문제를 처리 할 수있는 다른 임의 효과 모델이 있습니다. 그들은 아직 계량 경제학 패키지 / 문학의 일부가 아닙니다. 고정 및 랜덤 효과에 대한 계량 경제학 정의는 매우 도메인에 따라 다르며 통계 문헌에서보다 근본적인 일반적인 의미를 나타내지 않는 것 같습니다.

— Paul

4

페어 포인트, 나는 약간 편집했다. 그러나 imo, 이것이 바로이 글타래를 매우 소중하게 만드는 것입니다. 다른 분야는 거의 같은 용어로 다른 것을 의미하며, 다양한 게시물은 이러한 차이점을 설명하는 데 도움이됩니다.

— Christoph Hanck

12

이 차이는 베이 아 이외의 통계 상황에서만 의미가 있습니다. 베이지안 통계에서 모든 모형 모수는 "무작위"입니다.

— 시게
소스

1

흥미 롭군 그러나 고정 또는 무작위는 해당 변수와 관련된 매개 변수가 아닌 주어진 변수 (주어진 데이터 열)의 조건으로 간주 될 수 있으므로 대답이 완전히 적용됩니까?

— rolando2

1

@ rolando2 어쨌든 이것은 단순히 거짓입니다. 특히 베이지안의 경우 매개 변수는 이론 / 가능성이 말하는 어떤 종류의 것입니다. 그들이 취하는 가치에 대한 불확실성 만 확률 분포를 사용하여 표현됩니다. 결과적으로 매개 변수는 고정적이고 알려지지 않은 ( '고정 된') 모델로, 때로는 분포 ( '임의 한')에서 나온 것으로 모델링되는데, 후자의 장치는 종종 샘플링 프로세스에 대한 믿음이 아니라 교환 성 판단에 의해 동기가 부여됩니다.

— 켤레 이전

이것은 @ben 답변과 대조적입니다. 나는 대답이 틀렸다고 믿는다.

— SmallChess

9

계량 경제학에서 항은 일반적으로 모형이 형식 인 일반 선형 모형에 적용됩니다.

y_{i t} = g (x_{i t} β + α_{i} + u_{i t}) .

$y_{it} = g(x_{it} \beta + \alpha_i + u_{it}).$

랜덤 효과 : 때 , $\alpha_i \perp u_{it}$

해결 된 효과 : When . $\alpha_i \not \perp u_{it}$

에서는 선형 모델 랜덤 효과의 존재는 OLS 추정기의 불일치가 발생하지 않는다. 그러나 임의의 효과 추정기 (예 : 실현 가능한 일반 최소 제곱)를 사용하면보다 효율적인 추정기가 만들어집니다.

에서는 비선형 모델 등의 프로 빗 토비트로서, ... 임의의 효과의 존재는 일반적으로 불일치 추정 될 것이다. 랜덤 효과 추정기를 사용하면 일관성이 복원됩니다.

선형 및 비선형 모델의 경우 고정 효과로 인해 바이어스가 발생합니다. 그러나 선형 모형에는 변환 된 데이터의 OLS가 일관된 추정치를 생성하는 데 사용할 수있는 변환 (예 : 첫 번째 차이 또는 무시)이 있습니다. 비선형 모델의 경우 변환이 존재하는 몇 가지 예외가 있으며 고정 효과 로짓 이 한 예입니다.

예 : 랜덤 효과 프로 빗. 가정

y_{i t}^{*} = x_{i t} β + α_{i} + u_{i t}, α_{i} \sim N (0, σ_{α}^{2}), u_{i t} \sim N (0, 1) .

$y^*_{it} = x_{it} \beta + \alpha_i + u_{it}, \quad \alpha_i \sim \mathcal{N}(0,\sigma_\alpha^2), u_{it} \sim \mathcal{N}(0,1).$

관찰 된 결과는

y_{i t} = 1 (y_{i t}^{*} > 0) .

$y_{it} = \mathbb{1}(y^*_{it} > 0).$

풀링 최대 우도 추정기 의 샘플 평균을 최소화

\hat{β} = \arg min_{β} N^{- 1} \sum_{i = 1}^{N} \log \prod_{t = 1}^{T} [G (x_{i t} β)]^{y_{i t}} [1 - G (x_{i t} β)]^{1 - y_{i t}} .

$\hat{\beta} = \arg \min_\beta N^{-1} \sum_{i=1}^N \log \prod_{t=1}^T [G(x_{it}\beta)]^{y_{it}} [1 - G(x_{it}\beta)] ^{1-y_{it}}.$

물론 여기에서 로그와 제품은 단순화되지만 교육 학적 이유로 방정식을 랜덤 효과 추정기와 비교할 수 있습니다.

\hat{β} = \arg min_{β} N^{- 1} \sum_{i = 1}^{N} \log \int \prod_{t = 1}^{T} [G (x_{i t} β + σ_{α} a)]^{y_{i t}} [1 - G (x_{i t} β + σ_{α} a)]^{1 - y_{i t}} ϕ (a) d a .

$\hat{\beta} = \arg \min_\beta N^{-1} \sum_{i=1}^N \log \int \prod_{t=1}^T [G(x_{it}\beta + \sigma_\alpha a)]^{y_{it}} [1 - G(x_{it}\beta + \sigma_\alpha a )] ^{1-y_{it}} \phi(a) \mathrm{d}a.$

예를 들어 랜덤 노멀의 드로우를 취하고 각각에 대한 가능성을 평가 함으로써 랜덤 화에 의해 적분을 근사화 할 수 있습니다 . $R$

\hat{β} = \arg min_{β} N^{- 1} \sum_{i = 1}^{N} \log R^{- 1} \sum_{r = 1}^{R} \prod_{t = 1}^{T} [G (x_{i t} β + σ_{α} a_{r})]^{y_{i t}} [1 - G (x_{i t} β + σ_{α} a)]^{1 - y_{i t}}, a_{r} \sim N (0, 1) .

$\hat{\beta} = \arg \min_\beta N^{-1} \sum_{i=1}^N \log R^{-1} \sum_{r=1}^R \prod_{t=1}^T [G(x_{it}\beta + \sigma_\alpha a_r)]^{y_{it}} [1 - G(x_{it}\beta + \sigma_\alpha a )] ^{1-y_{it}},\quad a_r \sim \mathcal{N}(0,1).$

직관은 다음과 같습니다 . 각 관측치가 어떤 유형 인 인지 모릅니다 . 대신, 우리는 일련의 추첨에 대한 시간 경과에 따른 우도의 곱을 평가합니다. 가장 가능성있는 관측 유형 는 모든 기간에서 가장 높은 가능성을 가지므로 관측의 시퀀스에 대한 가능성 기여를 지배 할 것 입니다. $\alpha_i$ $i$ $T$

— 슈퍼 프론 커
소스

7

공식적인 정의는 아니지만 다음 슬라이드를 좋아합니다. 혼합 모델과 사회학자가 Daniel Ezra Johnson의 모델을 사용해야하는 이유 ( 미러 ). 슬라이드 4에는 간단한 요약이 제공됩니다. 심리 언어학 연구에 주로 초점을 맞추었지만 첫 단계로 매우 유용합니다.

— chl
소스

나는 그 영향을 완전히 받기 위해서는 그 프레젠테이션을 직접 볼 필요가 있다고 생각한다.

— Andy W

이 슬라이드는 유용하지 않습니다.

— 비행

7

이 링크가 질문에 대한 답변을 제공 할 수 있지만 여기에 답변의 필수 부분을 포함시키고 참조 용 링크를 제공하는 것이 좋습니다. 링크 된 페이지가 변경되면 링크 전용 답변이 유효하지 않을 수 있습니다.

— 벤 볼커

1

링크가 죽었다

— baxx

3

랜덤 및 고정 효과 모델에 대한 또 다른 매우 실용적인 관점은 패널 데이터 에서 선형 회귀 분석을 수행 할 때 계량 경제학에서 비롯됩니다 . 개별 / 그룹당 여러 샘플이있는 데이터 세트에서 설명 변수와 결과 변수 간의 연관성을 추정하는 경우 사용하려는 프레임 워크입니다.

패널 데이터의 좋은 예는 다음과 같은 개인의 연간 측정입니다.

$gender_i$ ( 번째 사람의 성별 ) $i$
${\Delta}weight_{it}$ ( 사람 년 동안 체중 변화 ) $t$ $i$
$exercise_{it}$ ( 사람 연간 운동 평균 평균 ) $t$ $i$

운동과 체중 변화의 관계를 이해하려는 경우 다음과 같은 회귀 분석을 설정합니다.

${\Delta}weight_{it} = \beta_0$ $exercise_{it} + \beta_1gender_i + \alpha_i + \epsilon_{it}$

$\beta_0$ 은 관심 수량입니다
$\beta_1$ 은 않습니다. 우리는 단지 성별을 통제하고 있습니다.
$\alpha_i$ 는 개인별 가로 채기입니다
$\epsilon_{it}$ 은 오류 용어입니다

이와 같은 설정에서는 내생의 위험이 있습니다. 이는 측정되지 않은 변수 (예 : 결혼 여부)가 운동 및 체중 변화와 관련이있을 때 발생할 수 있습니다. 이 프린스턴 강의 에서 16 페이지에 설명 된 것처럼 랜덤 효과 (AKA 혼합 효과) 모델은 고정 효과 모델보다 더 효율적입니다. 그러나 측정되지 않은 변수가 체중 변화에 미치는 영향 중 일부는 운동에 영향을 잘못된 생성 하고 잠재적으로 유효한 것보다 통계적 유의성이 더 높습니다. 이 경우 랜덤 효과 모델은 의 일관성있는 추정기가 . $\beta_0$ $\beta_0$

고정 효과 모델 (가장 기본적인 형식)은 시간이 지남에 따라 일정하지만 회귀 방정식의 각 개인 ( )에 대해 별도의 절편 항을 명시 적으로 포함하여 개인마다 달라지는 측정되지 않은 변수에 대해 제어합니다 . 이 예에서는 성별에 따른 혼란스러운 영향과 측정되지 않은 모든 혼란스러운 자 (결혼 상태, 사회 경제적 상태, 교육 성취도 등)를 자동으로 제어합니다. 실제로는 성별을 회귀에 포함 수 없으며 가 와 동일하기 때문에 고정 효과 모델로 을 추정 할 수 없습니다 . $\alpha_i$ $\beta_1$ $gender_i$ $\alpha_i$

따라서 중요한 질문은 어떤 모델이 적합한 지 결정하는 것입니다. 대답은 하우스 만 테스트 입니다. 이를 사용하기 위해 고정 및 랜덤 효과 회귀 분석을 수행 한 다음 Hausman Test를 적용하여 계수 추정치가 크게 다른지 확인합니다. 그들이 발산하면 내 생성이 작용하고 고정 효과 모델이 최선의 선택입니다. 그렇지 않으면 임의의 효과가 적용됩니다.

— 톰 큐
소스

고정 효과, 임의 효과 및 혼합 효과 모델의 차이점은 무엇입니까?

랜덤 대 고정 효과

예

계층 적 베이지안 모델링과의 관계