모든 가능성이 혼합 효과 모델에 포함 된 경우 고정 효과 대 임의 효과


15

혼합 효과 모델에서는 모든 가능한 수준 (예 : 남성과 여성 모두)이 포함 된 경우 고정 효과를 사용하여 매개 변수를 추정하는 것이 좋습니다. 포함 된 수준이 모집단의 무작위 표본 (가능한 환자의 우주에서 등록 된 환자)이고 평균 대신 모집단 평균 및 분산을 추정하려는 경우 무작위 효과를 사용하여 변수를 설명하는 것이 좋습니다. 개별 요인 수준의.

나는 당신이 논리적으로 항상 이런 식으로 고정 효과를 사용 해야하는지 궁금합니다. 발 / 신발의 크기가 발달에 따라 어떻게 변화하는지, 키, 체중 및 나이와 관련이있는 연구를 고려하십시오. Side수년에 걸친 측정이 주어진 발 안에 중첩되어 있고 독립적이지 않다는 사실을 설명하기 위해 모델에 명확하게 포함되어야합니다. 또한 오른쪽과 왼쪽이 존재할 수있는 모든 가능성입니다. 또한 특정 참가자의 경우 오른발이 왼쪽보다 더 크거나 작다는 것은 매우 사실입니다. 그러나 발 크기는 모든 사람의 발 사이에서 다소 차이가 있지만, 오른발이 평균적으로 왼발보다 크다고 믿을 이유는 없습니다. 그것들이 당신의 샘플에 있다면, 이것은 아마도 오른발에 본질적인 것이 아니라 샘플에있는 사람들의 유전학에 관한 것입니다. 마지막 귀찮은 매개 변수, 당신이 정말로 걱정하지 뭔가처럼 보인다. side

이 예제를 만들었습니다. 좋지 않을 수 있습니다. 그냥 아이디어를 얻는 것입니다. 내가 아는 한, 구석기 시대의 생존을 위해서는 큰 오른발과 작은 왼발이 필요했습니다.

이와 같은 경우에는, 통합 (이상 / 이하 / 어떤) 의미 할 것이다 임의 효과로 모델? 여기서 고정 효과와 무작위 효과를 사용할 때의 장단점은 무엇입니까? side


요인의 두 가지 수준과 두 가지 수준이 있다고 가정 할 때 왜 측면 을 랜덤 요인으로 취급 하시겠습니까? 문제 설정에서 임의성이 어디에서 발생합니까?
Aaron Zeng

@AaronZeng, 내 예제의 품질을 제쳐두고, 이것이 내 질문입니다. 가능한 모든 레벨이 있다면 임의의 효과로 레벨을 표현할 이유가 있습니까? 문제의 요인이> 2 수준 인 경우 어떻게합니까?
gung-Monica Monica 복원

1
@ gung 방금이 스레드로 돌아 왔습니다-답변이 도움이 되었습니까? 그렇지 않다면 무엇을 더 배우고 싶습니까? 어쩌면 당신은 당신 자신의 대답을 가지고 있습니다 (그렇다면이 문제에 대해 더 많이 배우고 싶습니다!)?

2
@Tim에 돌아온 지 오래되었습니다. 나는 두 대답 모두 고맙지 만 (나는 그들을 찬성했다), 그들은 내가 찾고있는 것이 아닙니다 (아마도 명확한 질문 진술로 인해). 벤 볼커 (Ben Bolker)가 다양한 장소에 게시 한 내용에서 답변을 컴파일하는 것에 대해 생각했지만 약간의 작업이었고 실제로는 결코 얻지 못했습니다. 그래도 여전히해야 할 일입니다. 너지 주셔서 감사합니다.
gung-모니 티 복원

답변:


13

"고정"및 "무작위"효과의 일반적인 문제는 효과가 일관된 방식으로 정의되지 않는다는 것입니다. Andrew Gelman은 다음 중 몇 가지를 인용 합니다.

(1) 고정 효과는 개인마다 일정하며 무작위 효과는 다양합니다. 예를 들어, 성장 연구에서 랜덤 절편 및 고정 기울기 b를 갖는 모델 은 다른 개인 i의 평행선 또는 y i t = a i + b t 모델에 해당 합니다. Kreft와 ​​De Leeuw (1998)는 고정 계수와 랜덤 계수를 구분합니다.나는나는와이나는=나는+

(2) 효과는 그 자체가 흥미 롭거나 기초 집단에 관심이 있다면 무작위로 고정됩니다. Searle, Casella 및 McCulloch (1992, 1.4 절)는 이러한 차이점을 심층적으로 탐구합니다.

(3)“표본이 모집단을 소진하면 해당 변수가 고정됩니다. 표본이 모집단의 작은 (즉, 무시할만한) 부분 인 경우 해당 변수는 무작위입니다.”(Green and Tukey, 1960)

(4)“효과가 랜덤 변수의 실현 된 값이라고 가정하면 랜덤 효과라고합니다.”(LaMotte, 1983)

(5) 고정 된 효과는 최소 제곱 (보다 일반적으로 최대 가능성)을 사용하여 추정하고 무작위 효과는 축소를 통해 추정합니다 (Robinson, 1991 년 용어에서 "선형 비 편향 예측"). 이 정의는 다단계 모델링 문헌 (예 : Snijders and Bosker, 1999, 섹션 4.2 참조)과 계량 경제학에서 표준입니다.

일관성 이 없다는 것을 알았습니다 . 그의 저서 인 회귀 및 다단계 / 계층 모델사용한 데이터 분석에서 그는 일반적으로 이러한 용어의 사용을 피하고 그들의 작업에서 그룹 가로 채기와 기울기 사이의 고정 또는 변화에 초점을 맞추고 있습니다.

고정 효과는 특수 효과의 특수한 경우로 볼 수 있으며, 상위 수준 분산 (모델 (1.1)에서는 )이 0 또는 ∞로 설정됩니다 . 그러므로 우리의 틀에서 모든 회귀 변수는“무작위”이며“다단계”라는 용어는 모든 것을 포괄합니다.σα20

이는 모든 효과가 그 자체로 무작위 인 혼합 모델에 일반적으로 사용되는 베이지안 프레임 워크에서 특히 그렇습니다. 베이지안을 생각하고 있다면 실제로 "고정 된"효과 및 점 추정치에 관심이 없으며 모든 효과를 무작위로 처리하는 데 아무런 문제가 없습니다.

이 주제에 대해 더 많이 읽을수록, 이것이 우리가 예측할 수있는 것과 예측할 수있는 것 (여기서 자신의 답변 을 참조 할 수있는 것)에 대한 이념적 인 토론이라고 확신합니다 . 가능한 결과 의 무작위 표본 이있는 경우 무작위 효과를 사용 하므로 개별 추정치에 대해 걱정하지 않고 모집단 효과, 개인에 대해 관심을 갖습니다. 따라서 귀하의 질문에 대한 답변은 데이터에 주어진 고정 효과 를 하거나 추정 할 수 있을지에 대한 귀하의 생각에 달려 있습니다 . 모든 가능한 수준이 데이터에 포함 된 경우에 당신은 할 수 있습니다고정 효과 추정-예와 같이 레벨 수는 적을 수 있으며 일반적으로 임의 효과를 추정하는 데 좋지 않으며 이에 대한 최소 요구 사항이 있습니다.

최상의 시나리오 논쟁

무제한의 데이터와 무제한의 계산 능력이 있다고 가정하십시오. 이 경우 고정 효과는 더 많은 유연성을 제공하기 때문에 모든 효과를 고정 된 것으로 추정 할 수 있습니다 (개별 효과를 비교할 수 있도록). 그러나이 경우에도 우리 대부분은 모든 것에 고정 된 효과를 사용하는 것을 꺼려 할 것입니다.

예를 들어, 일부 지역의 학교 시험 결과를 모델링하고 해당 지역의 100 개 학교 모두에 대한 데이터를 가지고 있다고 가정하십시오. 이 경우 모든 수준에 대한 데이터가 있기 때문에 학교를 고정 된 것으로 위협 할 수 있지만 실제로 는 무작위로 생각할 것 입니다. 왜 그런 겁니까?

  1. 한 가지 이유는 일반적으로 이러한 종류의 경우 개별 학교의 효과에 관심이없고 (모든 학교를 비교하기가 어렵 기 때문에) 학교 간의 일반적인 변동성 때문입니다.

  2. 여기에 또 다른 논쟁은 모델 parsimony입니다. 일반적으로 "모든 가능한 영향"모델에 관심이 없으므로 모델에는 다른 가능한 변동 원인을 테스트하고 제어하려는 고정 효과가 거의 없습니다. 이로 인해 혼합 효과 모델은 통계적 모델링에 대한 일반적인 사고 방식에 적합하게 만들 수 있습니다. 복잡한 (다중 수준 또는 계층 적) 데이터를 사용하면 많은 영향을 미치므로 일부는 "고정"으로, 일부는 "무작위"로 위협하여 제어 할 수 있습니다.

  3. 이 시나리오에서는 학교가 각각 고유하고 독특하며 결과에 영향을 미치는 것으로 생각하지 않고 일반적으로 영향을 미치는 학교에 대해 생각합니다. 이 인수는 우리가 있다는 것입니다 그래서 생각 즉 각 학교의 독특한 효과를 추정 정말 불가능하며 가능한 학교 효과의 무작위 표본으로 우리 위협을 그렇게.

혼합 효과 모델은 "모두 고정"시나리오와 "임의 임의"시나리오 사이에 있습니다. 우리가 만나는 데이터는 모든 것을 고정 효과로 추정하는 것에 대한 기대치를 낮추므로 비교할 효과와 제어 할 효과를 결정하거나 그 영향에 대한 일반적인 느낌을 갖습니다. 데이터가 무엇인지뿐만 아니라 데이터를 모델링하는 동안 데이터를 어떻게 생각하는지에 관한 것입니다.


여기에 좋은 점이 많이 있습니다. @Tim. OP에서 쿵의 모범에 대해 당신이 취하는 것이 궁금합니다. 내 답변 아래의 의견에 대한 긴 토론이 있었지만 지금까지는 거의 해결되었다고 생각합니다. 내가 쓴 것에 동의하거나 동의하지 않는지 아는 것이 좋을 것입니다.
amoeba는 Reinstate Monica가

@amoeba 흥미로운 답변 (이미 +1했습니다)이며 귀하의 요점에 동의합니다. 본질적으로 gung 은 단일 답변이 없다는 것이 옳다고 생각합니다 (항상 옳은 Gelman과 동일). 혼합 효과 모델을 사용하고 명확한 구분이없는 거대한 문헌과 여러 가지 방법이 있습니다. 또한 기본적으로 항상 모든 것에 고정 효과를 사용하는 사람들이 있으며, 일반적으로 고정 효과로 생각하는 경우에도 가능할 때마다 무작위 효과를 사용하는 사람들이 있습니다. 모델.
Tim

13

행정상 개요

실제로 가능한 모든 요인 수준이 혼합 모형에 포함 된 경우이 요인을 고정 효과로 취급해야한다고 종종 말하고 있습니다. 이것이 두 가지 뚜렷한 이유에 해당되는 것은 아닙니다.

(1) 레벨의 수가 많은 경우는 무작위로 [교차 팩터를 치료하는 말이.

여기에 @Tim과 @RobertLong에 동의합니다. 요인에 모형에 모두 포함 된 수준 (예 : 세계의 모든 국가 또는 국가의 모든 학교)이 모두 포함되어있는 경우 대상을 조사하는 등), 무작위로 취급하는 데 아무런 문제가 없습니다 .- 더 포용 적이며 약간의 축소를 제공 할 수 있습니다.

lmer(size ~ age + subjectID)                     # fixed effect
lmer(size ~ age + (1|subjectID))                 # random effect

(2) 요인이 다른 임의의 효과 내에 내포 된 경우 수준 수에 관계없이 임의의 것으로 간주해야합니다.

다른 답변이 위의 사례 1에 관한 것이기 때문에이 스레드에서 큰 혼란이있었습니다 (주석 참조). 주어진 예는 다른 상황, 즉이 사례 # 2의 예입니다. 여기에는 두 개의 레벨 (즉, "다수"가 아님) 만 있으며 모든 가능성을 소진하지만 다른 임의의 효과 안에 중첩되어 중첩 된 임의 효과 를 생성합니다.

lmer(size ~ age + (1|subject) + (1|subject:side)  # side HAS to be random

예제에 대한 자세한 토론

가상 실험의 측면과 주제는 표준 계층 모델 예에서 수업 및 학교와 관련이 있습니다. 아마도 각 학교 (# 1, # 2, # 3 등)에는 클래스 A와 클래스 B가 있으며이 두 클래스는 대략 동일해야합니다. 클래스 A와 B를 두 가지 레벨의 고정 효과로 모델링하지 않습니다. 이것은 실수 일 것입니다. 그러나 클래스 A와 B를 두 가지 수준의 "별도의"(즉, 교차 된) 임의 효과로 모델링하지 않습니다. 이것도 실수 일 것입니다. 대신 학교 내에서 클래스를 중첩 된 임의 효과 로 모델링 합니다.

여기를 참조하십시오 : 교차 및 중첩 된 무작위 효과 : lme4에서 어떻게 효과가 다르고 어떻게 올바르게 지정됩니까?

나는=1제이=1,2

크기나는제이케이=μ+α신장나는제이케이+β무게나는제이케이+γ나이나는제이케이+ϵ나는+ϵ나는제이+ϵ나는제이케이
ϵ나는(0,σ에스제이이자형에스2),각 주제에 대한 무작위 차단
ϵ나는제이(0,σ주제 측2),임의의 정수 주제에 중첩 된면의 경우
ϵ나는제이케이(0,σ소음2),오류 용어

자신이 쓴 것처럼 "오른발이 평균적으로 왼발보다 클 것이라고 믿을 이유가 없습니다". 따라서 오른발이나 왼발의 "전역 적"효과 (고정 또는 무작위 교차)가 없어야합니다. 대신, 각각의 주제는 "한"발과 "다른"발을 갖는 것으로 생각 될 수 있으며,이 가변성은 모델에 포함되어야합니다. 이 "한"및 "다른"피트는 피사체 내에 중첩되므로 중첩 된 임의 효과가 있습니다.

의견에 대한 자세한 내용. [9 월 26 일]

위의 모델에는 주제 내에서 측면이 중첩 된 무작위 효과로 포함되어 있습니다. @Robert가 제안한 대체 모델은 다음과 같습니다. 여기서 Side는 고정 효과입니다.

크기나는제이케이=μ+α신장나는제이케이+β무게나는제이케이+γ나이나는제이케이+δ측면제이+ϵ나는+ϵ나는제이케이

나는제이

그럴 순 없어.

Side를 교차 임의 효과로 사용하는 @gung의 가상 모델에 대해서도 마찬가지입니다.

크기나는제이케이=μ+α신장나는제이케이+β무게나는제이케이+γ나이나는제이케이+ϵ나는+ϵ제이+ϵ나는제이케이

종속성도 설명하지 못합니다.

시뮬레이션을 통한 데모 [10 월 2 일]

다음은 R의 직접적인 데모입니다.

나는 5 년 연속 두 발로 측정 된 5 명의 대상으로 장난감 데이터 세트를 생성합니다. 나이의 영향은 선형입니다. 각 피험자는 무작위로 절편을합니다. 그리고 각각의 대상은 다른 것보다 큰 발 중 하나 (왼쪽 또는 오른쪽)를 가지고 있습니다.

set.seed(17)

demo = data.frame(expand.grid(age = 1:5,
                              side=c("Left", "Right"),
                              subject=c("Subject A", "Subject B", "Subject C", "Subject D", "Subject E")))
demo$size = 10 + demo$age + rnorm(nrow(demo))/3

for (s in unique(demo$subject)){
  # adding a random intercept for each subject 
  demo[demo$subject==s,]$size = demo[demo$subject==s,]$size + rnorm(1)*10

  # making the two feet of each subject different     
  for (l in unique(demo$side)){
    demo[demo$subject==s & demo$side==l,]$size = demo[demo$subject==s & demo$side==l,]$size + rnorm(1)*7
  }
}

plot(1:50, demo$size)

나의 끔찍한 R 기술에 대한 사과. 데이터의 모양은 다음과 같습니다 (각 연속 5 점은 1 년에 한 사람의 1 피트, 연속 10 점은 같은 사람의 2 피트입니다).

여기에 이미지 설명을 입력하십시오

이제 우리는 많은 모델에 맞출 수 있습니다 :

require(lme4)
summary(lmer(size ~ age + side + (1|subject), demo))
summary(lmer(size ~ age + (1|side) + (1|subject), demo))
summary(lmer(size ~ age + (1|subject/side), demo))

모든 모델에는의 고정 효과 age와 임의의 효과가 포함 subject되지만 side다르게 취급 됩니다.

  1. sideage=1.8

  2. sideage=1.4

  3. sideage=37

이것은 side중첩 된 랜덤 효과로 취급되어야한다는 것을 분명히 보여줍니다 .

마지막으로 의견에서 @Robert는 전역 side변수를 제어 변수로 포함하도록 제안했습니다 . 중첩 된 랜덤 효과를 유지하면서 할 수 있습니다 :

summary(lmer(size ~ age + side + (1|subject/side), demo))
summary(lmer(size ~ age + (1|side) + (1|subject/side), demo))

side=0.5side


2
이 예제에서 side요인이 임의 대 고정으로 취급되어야 할 때의 일반적인 정의 / 지침을 충족 한다고 생각하지 않습니다 . 특히, 표본의 요인 수준을 넘어 추론하는 것은 의미가 없습니다. 더욱이, 2 단계의 요소만으로, 고정 된 것으로 취급하는 것은 모델링에 접근하는 명백하고 직접적인 방법으로 보입니다.
Robert Long

로버트, 답변 주셔서 감사합니다. 나는 완전히 혼란스러워하거나 의미하는 바를 제대로 설명하지 못했습니다. side고정 효과로 취급 한다는 것은 한 쪽 (예 : 오른쪽)이 항상 다른 쪽 (왼쪽)보다 일정량 더 크다고 가정하는 것을 의미합니다. 이 금액은 모든 사람에게 동일합니다. 입니다 명시 적으로 영업 이익이 생각했던 것이 아니다. 그는 어떤 사람들에게는 오른쪽이 더 클 수도 있고 어떤 다른 사람들에게는 왼쪽에 있다고 썼습니다. 그러나 side관련 오류로 인한 원인 을 고려해야 합니다. 그렇다면 왜 우리는 중첩 된 랜덤 효과로 취급 할 수 없습니까? 학교 내 수업과 똑같습니다.
amoeba는

나는 그것이 반드시 그것을 암시한다는 것을 모른다. 말하는 것은, 샘플에서, 측면들 사이에 체계적인 차이가있을 수 있다는 것입니다 (샘플링 변동으로 인해 아티팩트 일 수도 있고 아닐 수도 있음). 비 독립성에 대한 "통제"라는 고정 된 효과로 포함시키는 것을 더 선호합니다. 모델에 혼란을 심어주고 계수 해석을 꿈꾸지 않는 것과 같은 방식입니다.
Robert Long

2
추가 반영 후 귀하의 답변을지지합니다. 당신은 정말 흥미로운 점을 제기합니다. 나는 지금 이것의 수학을 탐구 할 시간이 없다. 가능한 경우 가지고 놀 수있는 장난감 데이터 셋을 찾고 싶습니다 (만약 알고 있다면 알려주세요)
Robert Long

2
+1, 자세히 살펴보면이 연구의 특징에 대해 옳은 것 같습니다. 모든 가능성이 포함될 때 고정 대 무작위 효과에 대한 단일 답변이 없다는 큰 점이 있습니까? 각 사례를 개별적으로 평가해야합니다.
gung-모니 티 복원

7

다른 답변에 추가하려면 다음을 수행하십시오.

나는 당신이 논리적으로 항상 OP에 설명 된 방식으로 고정 효과를 사용해야한다고 생각하지 않습니다. 인자를 랜덤으로 취급하는 경우에 대한 일반적인 정의 / 지침이 충족되지 않더라도, 많은 수의 레벨이있을 때 인자를 랜덤으로 모델링하는 경향이있을 수 있습니다. 자유롭고 성 가시고 덜 교묘 한 모델을 만듭니다.


이것은 합리적 인 포인트처럼 보입니다. 내 예에 눈이 멀지 않은 것에 감사드립니다. 나는 이것으로부터 & @amoeba의 대답에 대한 귀하의 의견에 "많은 수준이있을 때"( "2 수준의 요인 만 있음")가 핵심 인 것처럼 보입니다.
gung-모니 티 복원

1
나는이 점에 동의하기 때문에 하나는, 그것은 나를 드라이브 비트 너트 나는 나의 점을 설명하기 위해 실패하고도 @gung도 내가 무엇을 의미하는지 볼 수있다. 치료 side중 하나와 같은 고정 또는 교차 임의 효과로 반드시 측면 (예를 들어 오른쪽) 중 하나가 항상 모든 주제에 대해, (왼쪽) 다른 것보다 더 큰 가정을 의미합니다. 이것은 gung이 OP에서 썼던 것이 아니라 "오른발이 평균적으로 왼발보다 크다고 믿을 이유가 없다"고 진술 한 것은 아니다. 나는 gung의 예제를 학교 내 수업과 완전히 유사하게 중첩 된 무작위 효과의 명확한 사례로보고 있습니다.
amoeba는

@amoeba 재미있는 포인트지만 동의하지 않습니다. 귀하의 답변에 대한 의견에 의견을 말하겠습니다 ...
Robert Long

4

가능한 모든 관심 요소 수준을 알고 있고 효과를 추정 할 데이터가있는 상황에 대해 이야기하고 있다면 임의 효과가있는 수준을 나타낼 필요는 없습니다.

요인에 임의 효과를 설정하려는 이유는 일반적으로 알 수없는 해당 요인의 모든 수준의 효과에 대해 추론하기 때문입니다. 이런 종류의 추론을 만들기 위해 모든 수준의 효과가 일반적으로 정규 분포를 형성한다고 가정합니다. 그러나 문제 설정이 주어지면 모든 수준의 영향을 추정 할 수 있습니다. 그런 다음 임의의 효과를 설정하고 추가 가정을 부과 할 필요가 없습니다.

그것은 모집단의 모든 값을 얻을 수있는 상황과 같지만 (따라서 진정한 평균을 알고 있음) 모집단에서 큰 표본을 가져 와서 중앙 분포 정리를 사용하여 표본 분포를 근사하고 진정한 의미를 추론하십시오.


2
한 가지 의견 : 때로는 모든 수준을 가지고 있지만 여전히 임의의 효과를 사용합니다. 예를 들어 교육에 대한 국가 별 연구를 수행하고 모든 학교에 대한 데이터를 보유하고 있지만 여전히 각 학교에 인형을 사용하는 대신 학교에 무작위 효과를 사용합니다.
Tim
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.