선형 혼합 모델의 함정


18

선형 혼합 효과 모델 사용의 주요 함정은 무엇입니까? 모델의 적합성을 평가할 때 테스트 /주의해야 할 가장 중요한 것은 무엇입니까? 동일한 데이터 집합의 모델을 비교할 때 가장 중요한 것은 무엇입니까?

답변:


16

좋은 질문입니다.

일반적인 함정은 다음과 같습니다.

  1. 표준 우도 이론을 사용 하여 우도 비 검정 통계량을 계산하여 두 개의 중첩 된 가설 과 을 비교하는 검정을 도출 할 수 있습니다 . 이 검정 통계량의 귀무 분포는 자유도가 두 모수 공간의 차원 차이와 거의 카이 제곱입니다. 불행히도이 테스트는 대략적인 것이며 몇 가지 가정이 필요합니다. 한 가지 중요한 가정은 널 아래의 매개 변수가 매개 변수 공간의 경계에 있지 않다는 것입니다. 우리는 종종 다음과 같은 형식의 랜덤 효과에 대한 가설을 테스트하는 데 관심이 있습니다. 이것은 실제 관심사입니다.H0H1

    H0:σ2=0
    이 문제를 해결하는 방법은 REML을 사용하는 것입니다. 그러나 여전히 p- 값은 원래보다 커지는 경향이 있습니다. 즉, χ2 근사법을 사용하여 유의미한 효과를 관찰하면 실제로 유의하다는 확신을 가질 수 있습니다. 작지만 중요하지 않은 p- 값은보다 정확하지만 시간이 많이 걸리는 부트 스트랩 방법을 사용하도록 박차를 가할 수 있습니다.
  2. 고정 효과 비교 : 우도 비율 검정을 사용하여 고정 효과 만 다른 두 개의 중첩 모형을 비교하려는 경우 REML 추정 방법을 사용할 수 없습니다. 그 이유는 REML이 고정 효과를 제거하는 데이터의 선형 조합을 고려하여 임의 효과를 추정하기 때문입니다. 이러한 고정 효과가 변경되면 두 모델의 가능성을 직접 비교할 수 없습니다.

  3. P- 값 : 고정 효과에 대한 우도 비율 테스트에 의해 생성 된 p- 값은 근사치이며 불행히도 너무 작아서 일부 효과의 중요성을 간과하는 경우가 있습니다. 비모수 부트 스트랩 방법을 사용 하여 우도 비 검정을위한보다 정확한 p- 값을 찾을 수 있습니다.

  4. Doug Bates 박사가 강조한 고정 효과 시험의 p- 값에 대한 다른 우려가 있습니다 [ 여기 ].

포럼의 다른 구성원이 더 나은 답변을 얻을 것이라고 확신합니다.

출처 : R-Dr. Julain Faraway로 선형 모델 확장.


9

내가 볼 수있는 일반적인 함정은 임의 효과의 분산을 무시하는 것입니다. 잔차 분산 또는 종속 변수 분산과 비교하여 크면 랜덤 효과가 모든 분산을 설명하기 때문에 적합하게 나타납니다. 그러나 실제 대 예측 그래프가 멋지게 보이기 때문에 모델이 좋다고 생각하는 경향이 있습니다.

이러한 모델을 사용하여 새 데이터를 예측하면 모든 것이 무너집니다. 일반적으로 고정 효과 만 사용할 수 있으며 맞춤이 매우 열악 할 수 있습니다.


6

분산 구조 모델링은 혼합 모델에서 가장 강력하고 중요한 단일 기능 일 것입니다. 이는 분산 구조를 넘어서서 관측 값 간의 상관 관계를 포함합니다. 적절한 공분산 구조를 구축하기 위해주의를 기울여야합니다. 그렇지 않으면 가설, 신뢰 구간 및 치료 수단의 추정치에 대한 검정이 유효하지 않을 수 있습니다. 종종 정확한 무작위 효과를 지정하기 위해 실험에 대한 지식이 필요합니다.

R에서 분석을 수행하려는 경우에도 SAS for Mixed Models를 사용합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.