혼합 효과 모델을 어떻게 비교하고 검증해야합니까?


22

(선형) 혼합 효과 모델은 일반적으로 서로 어떻게 비교됩니까? 가능성 비율 테스트를 사용할 수 있지만 한 모델이 다른 모델의 '서브셋'이 아닌 경우 작동하지 않습니다.

모델 df의 추정은 항상 간단합니까? 고정 효과 수 + 분산 성분 수 추정? 랜덤 효과 추정값을 무시합니까?

유효성 검사는 어떻습니까? 내 첫 번째 생각은 교차 검증이지만 데이터 구조에 따라 임의의 접기가 작동하지 않을 수 있습니다. '한 과목 / 클러스터를 떠나는'방법론이 적절합니까? 하나의 관찰을 생략하는 것은 어떻습니까?

맬로 Cp는 모델 예측 오차의 추정치로 해석 될 수 있습니다. AIC를 통한 모델 선택은 예측 오류를 최소화하려고 시도합니다 (따라서 오류가 가우시안 인 경우 Cp와 AIC는 동일한 모델을 선택해야 함). 이것은 AIC 또는 Cp를 사용하여 예측 오류 측면에서 중첩되지 않은 일부 모델 모음에서 '최적의'선형 혼합 효과 모델을 선택할 수 있습니까? (동일한 데이터에 적합하다면) BIC는 여전히 후보자 중에서 '진정한'모델을 선택할 가능성이 더 높습니까?

또한 AIC 또는 BIC를 통해 혼합 효과 모델을 비교할 때 실제 모델 df가 아니라 계산에서 고정 효과 만 '파라미터'로 계산한다는 인상을 받고 있습니다.

이 주제들에 대한 좋은 문헌이 있습니까? cAIC 또는 mAIC를 조사 할 가치가 있습니까? AIC 외부에 특정 응용 프로그램이 있습니까?


2
cAIC 또는 mAIC "AIC 외부"를 적용한다는 것은 무슨 의미입니까? DIC는 다단계 모델에 포함 된 "유효한"매개 변수 수에 의해 불이익을가하려고 조사 할 수있는 널리 사용되는 예측 정확도 측정입니다.
손님

@guest 내 말은, 특정 유형의 모델에 대해 특정 용도가 있습니까? DIC을 확인하겠습니다. 고맙습니다.
dcl

답변:


12

혼합 모델에서 모델 선택의 주요 문제점은 모델의 자유도 (df)를 정의하는 것입니다. 혼합 모형의 df를 계산하려면 고정 및 랜덤 효과를 포함하여 추정 된 매개 변수의 수를 정의해야합니다. 그리고 이것은 간단하지 않습니다. Jiming Jiang과 그 외 (2008)의 제목이 "혼합 모델 선택을위한 울타리 방법"이라는 제목의 논문 이 그러한 상황에 적용될 수 있습니다. 새로운 관련 작업이 있습니다 하나 "선형 혼합 모델의 한계와 조건 AIC의 행동에"라는 제목 Greven, S. & Kneib, T. (2010)에 의해. 이것이 도움이 되길 바랍니다.


그 서류들을 확인해 볼게요. 건배.
dcl

6

모델을 비교하는 한 가지 방법은 (혼합이든 아니든) 결과를 플로팅하는 것입니다. 모형 A와 모형 B를 가정 해 봅시다. 각각에서 적합치를 생성하고 산점도에서 서로에 대해 그래프로 표시합니다. 값이 매우 유사한 경우 (값인지 여부를 판단하여) 더 간단한 모형을 선택하십시오. 또 다른 아이디어는 적합치 간의 차이를 찾아 독립 값과 비교하여 그래프를 만드는 것입니다. 차이의 밀도 플롯을 만들 수도 있습니다. 일반적으로, 나는 모델을 비교하기 위해 통계 테스트를 사용 하지 않고 (AIC와 그 변형이 확실히 장점을 가지고 있지만) 판단을 사용하는 것을지지합니다. 물론 이것은 정확한 답변을 제공하지 않는 단점이 있습니다.


당신이 묘사하는 것은 단지 주요 목표가 예측 능력 일 때 모델을 비교하는 것입니다. 또한 그래픽 결과는 모델이 유용 할 수있는 모델을 안내하는 데 도움이 될 수 있지만 일반적으로 완전히 공식적인 과학적 결과는 아닙니다.
hbaghishani

2
안녕 @hbaghishani; Tukey는 "올바른 질문에 대한 정확한 답은 항상 정확할 수있는 잘못된 질문에 대한 정확한 답보다 모호한 것입니다." :-). 여기에 완전히 제안 된 것은 아니지만, 적어도 부분적으로는 목표입니다
Peter Flom-Reinstate Monica

1
나는 일반적으로 모델 작성 중에 설명하는 것과 같은 플롯을 수행합니다. 그러나 나는 실제로 더 '수학적'방법을 찾고있었습니다. 건배
dcl

예측 성능을 기반으로 다른 모델을 비교하는 경우 무작위 효과가 있거나없는 혼합 모델의 예측 값이 동일해야합니다 (즉, 임의 효과가 있거나없는 모델에서는 회귀 계수가 편향되지 않고 표준 오류 만 변경됨).
RobertF
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.