행정상 개요
실제로 가능한 모든 요인 수준이 혼합 모형에 포함 된 경우이 요인을 고정 효과로 취급해야한다고 종종 말하고 있습니다. 이것이 두 가지 뚜렷한 이유에 해당되는 것은 아닙니다.
(1) 레벨의 수가 많은 경우는 수 무작위로 [교차 팩터를 치료하는 말이.
여기에 @Tim과 @RobertLong에 동의합니다. 요인에 모형에 모두 포함 된 수준 (예 : 세계의 모든 국가 또는 국가의 모든 학교)이 모두 포함되어있는 경우 대상을 조사하는 등), 무작위로 취급하는 데 아무런 문제가 없습니다 .- 더 포용 적이며 약간의 축소를 제공 할 수 있습니다.
lmer(size ~ age + subjectID) # fixed effect
lmer(size ~ age + (1|subjectID)) # random effect
(2) 요인이 다른 임의의 효과 내에 내포 된 경우 수준 수에 관계없이 임의의 것으로 간주해야합니다.
다른 답변이 위의 사례 1에 관한 것이기 때문에이 스레드에서 큰 혼란이있었습니다 (주석 참조). 주어진 예는 다른 상황, 즉이 사례 # 2의 예입니다. 여기에는 두 개의 레벨 (즉, "다수"가 아님) 만 있으며 모든 가능성을 소진하지만 다른 임의의 효과 안에 중첩되어 중첩 된 임의 효과 를 생성합니다.
lmer(size ~ age + (1|subject) + (1|subject:side) # side HAS to be random
예제에 대한 자세한 토론
가상 실험의 측면과 주제는 표준 계층 모델 예에서 수업 및 학교와 관련이 있습니다. 아마도 각 학교 (# 1, # 2, # 3 등)에는 클래스 A와 클래스 B가 있으며이 두 클래스는 대략 동일해야합니다. 클래스 A와 B를 두 가지 레벨의 고정 효과로 모델링하지 않습니다. 이것은 실수 일 것입니다. 그러나 클래스 A와 B를 두 가지 수준의 "별도의"(즉, 교차 된) 임의 효과로 모델링하지 않습니다. 이것도 실수 일 것입니다. 대신 학교 내에서 클래스를 중첩 된 임의 효과 로 모델링 합니다.
여기를 참조하십시오 : 교차 및 중첩 된 무작위 효과 : lme4에서 어떻게 효과가 다르고 어떻게 올바르게 지정됩니까?
i = 1 … nj = 1 , 2
크기나는 j k= μ + α ⋅ 높이나는 j k+ β⋅ 무게나는 j k+ γ⋅ 나이나는 j k+ ϵ나는+ ϵ나는 j+ ϵ나는 j k
ϵ나는~ N( 0 , σ2s는 유 ㄴ J E C t 의) ,각 주제에 대한 무작위 차단
ϵ나는 j~ N( 0 , σ2주제 측) ,임의의 정수 주제에 중첩 된면의 경우
ϵ나는 j k~ N( 0 , σ2소음) ,오류 용어
자신이 쓴 것처럼 "오른발이 평균적으로 왼발보다 클 것이라고 믿을 이유가 없습니다". 따라서 오른발이나 왼발의 "전역 적"효과 (고정 또는 무작위 교차)가 없어야합니다. 대신, 각각의 주제는 "한"발과 "다른"발을 갖는 것으로 생각 될 수 있으며,이 가변성은 모델에 포함되어야합니다. 이 "한"및 "다른"피트는 피사체 내에 중첩되므로 중첩 된 임의 효과가 있습니다.
의견에 대한 자세한 내용. [9 월 26 일]
위의 모델에는 주제 내에서 측면이 중첩 된 무작위 효과로 포함되어 있습니다. @Robert가 제안한 대체 모델은 다음과 같습니다. 여기서 Side는 고정 효과입니다.
크기나는 j k= μ + α ⋅ 높이나는 j k+ β⋅ 무게나는 j k+ γ⋅ 나이나는 j k+ δ⋅ 측면제이+ ϵ나는+ ϵ나는 j k
나는 j
그럴 순 없어.
Side를 교차 임의 효과로 사용하는 @gung의 가상 모델에 대해서도 마찬가지입니다.
크기나는 j k= μ + α ⋅ 높이나는 j k+ β⋅ 무게나는 j k+ γ⋅ 나이나는 j k+ ϵ나는+ ϵ제이+ ϵ나는 j k
종속성도 설명하지 못합니다.
시뮬레이션을 통한 데모 [10 월 2 일]
다음은 R의 직접적인 데모입니다.
나는 5 년 연속 두 발로 측정 된 5 명의 대상으로 장난감 데이터 세트를 생성합니다. 나이의 영향은 선형입니다. 각 피험자는 무작위로 절편을합니다. 그리고 각각의 대상은 다른 것보다 큰 발 중 하나 (왼쪽 또는 오른쪽)를 가지고 있습니다.
set.seed(17)
demo = data.frame(expand.grid(age = 1:5,
side=c("Left", "Right"),
subject=c("Subject A", "Subject B", "Subject C", "Subject D", "Subject E")))
demo$size = 10 + demo$age + rnorm(nrow(demo))/3
for (s in unique(demo$subject)){
# adding a random intercept for each subject
demo[demo$subject==s,]$size = demo[demo$subject==s,]$size + rnorm(1)*10
# making the two feet of each subject different
for (l in unique(demo$side)){
demo[demo$subject==s & demo$side==l,]$size = demo[demo$subject==s & demo$side==l,]$size + rnorm(1)*7
}
}
plot(1:50, demo$size)
나의 끔찍한 R 기술에 대한 사과. 데이터의 모양은 다음과 같습니다 (각 연속 5 점은 1 년에 한 사람의 1 피트, 연속 10 점은 같은 사람의 2 피트입니다).
이제 우리는 많은 모델에 맞출 수 있습니다 :
require(lme4)
summary(lmer(size ~ age + side + (1|subject), demo))
summary(lmer(size ~ age + (1|side) + (1|subject), demo))
summary(lmer(size ~ age + (1|subject/side), demo))
모든 모델에는의 고정 효과 age
와 임의의 효과가 포함 subject
되지만 side
다르게 취급 됩니다.
side
age
t = 1.8
side
age
t = 1.4
side
age
t = 37
이것은 side
중첩 된 랜덤 효과로 취급되어야한다는 것을 분명히 보여줍니다 .
마지막으로 의견에서 @Robert는 전역 side
변수를 제어 변수로 포함하도록 제안했습니다 . 중첩 된 랜덤 효과를 유지하면서 할 수 있습니다 :
summary(lmer(size ~ age + side + (1|subject/side), demo))
summary(lmer(size ~ age + (1|side) + (1|subject/side), demo))
side
t = 0.5side