모델에 임의 효과를 포함시키는 경우


9

나는 혼합 모델링을 처음 사용하고 있으며 내가 수행하는 분석에서 임의의 효과를 사용하는 것이 적절한 지 혼란 스럽습니다. 모든 조언을 부탁드립니다.

저의 연구는 새로 개발 된 포유 동물 풍부도 지수가 확립되었지만 노동 집약적 인 지수의 가치를 얼마나 잘 예측할 수 있는지 테스트하고 있습니다. 각 포리스트 패치에 여러 줄거리가있는 여러 포리스트 패치 에서이 색인을 측정했습니다.

나는 산림 패치의 효과에 직접 관심이 없으며 샘플 플롯이 산림 패치 내에 중첩되어 있기 때문에 산림 패치를 임의의 효과로 사용하고 있습니다. 그러나 이것에 대해 몇 가지 질문이 있습니다.

먼저 랜덤 효과를 사용하면 샘플링 한 것뿐만 아니라 임의의 가능한 모든 수준의 요소에 대해 결과를 일반화 할 수 있습니다. 그러나 이런 종류의 추론을하기 위해서는 레벨을 무작위로 샘플링해야합니까? 내 숲 패치는 무작위로 샘플링되지 않았으므로 여전히 무작위 효과로 사용할 수 있습니까?

둘째, 효과가 있거나없는 모델을 비교하기 위해 우도 비 테스트를 수행하여 임의 효과가 필요한지 여부를 테스트 할 수 있다는 것을 읽었습니다. 나는 이것을했고 랜덤 효과 모델은 고정 효과 전용 모델뿐만 아니라 데이터를 설명하지 않는다고 제안합니다. 이것에 대한 나의 문제는 내 음모가 여전히 숲 패치 내에 중첩되어 있기 때문에 아마도 독립적이지 않다는 것입니다. 따라서이 LRT 접근 방식을 사용하여 임의 효과 제외를 정당화 할 수 있습니까? 아니면 중첩을 설명하기 위해이 효과를 포함해야합니까? 무작위 효과를 제거하면 포리스트 패치 내의 플롯이 독립적으로 간주 될 수 있는지 확인하는 방법이 있습니까?

당신의 도움을 주셔서 감사합니다!

어치


무작위 효과의 주된 개념은 그것들이 모두 거의 같은 크기이고 교환 가능해야한다는 것입니다. 이것이 샘플링되지 않은 무작위 효과에 대한 추론을 가능하게합니다. 또한 ML / REML 추정치가 0이거나 0에 가깝더라도 분산 성분에 대한 상당한 불확실성이있을 수 있으므로 랜덤 효과에 대해 LR 테스트를 사용하는 데주의해야합니다.
probabilityislogic

랜덤 효과를 유지하는 데 필요한 경우 해결할 방법이 있습니까?
jay

내가 이해 한 바에 따르면 REML에 맞는 모델과 LR을 비교하지 않는 것이 가장 좋습니다. 예를 들어 R의 lmer에서는 LRT를 수행 할 때 REML = FALSE를 설정해야합니다. (기본값은 TRUE입니다. 그렇지 않으면 더 좋습니다.)
Wayne

답변:


6

내가 이해하는 것처럼, 당신은 간단한 중첩 된 관측 설계 (패치 내의 플로트)를 가지고 있으며 두 개의 연속 변수 (두 개의 지표) 사이의 상관 관계 / 회귀에 관심이 있습니다. 표본 크기는 m 패치 xn plots = N 쌍의 관측치 (또는 불균형 인 경우 적절한 요약)입니다. 적절한 무작위 배정은 포함되지 않았지만 아마도 (1)이 종류의 모든 패치 또는 일부 영역에서 패치가 "무작위로"선택된 다음 (2) 음모가 "무작위"인 것으로 간주 할 수 있습니다. 각 패치 내에서 선택됩니다.

랜덤 팩터 패치를 무시하면 N 개의 플롯을 임의로 선택한 패치에서 (이전의) 수로 제한하지 않고 "자유롭게"N 플롯을 선택한 것으로 간주하여 의사 복제하는 것일 수 있습니다.

첫 번째 질문입니다. 그렇습니다. 그것은 임의의 요인이 허용하는 것입니다. 이러한 추론의 유효성은 우연한 선택이 임의의 패치 선택과 동등하다는 가정의 유효성에 달려 있습니다 (예 : 다른 포리스트 패치 세트를 선택한 경우 결과가 다르지 않음). 따라서 추론 공간에도 한계가 있습니다. 결과가 확장되는 숲 또는 지리적 영역의 종류는 샘플이 신뢰할 수있는 "무작위"샘플 인 패치의 최대 (가상) 인구에 따라 다릅니다. 아마도 당신의 관찰은 당신의 지역에있는 산림 패치의 포유류에 대한 "합리적인 무작위"샘플 일 수도 있지만 대륙 전체의 포유류에 대한 의심스러운 집계 샘플 일 것입니다.

두 번째 테스트는 "의사 복제 정도"또는 패치에 "다음"을 나타내는 샘플의 증거에 따라 결정됩니다. 이것은 패치와 패치 내의 플롯 사이에 얼마나 많은 차이가 있는지입니다 (클래스 내 상관 관계 검색). 극단적으로 패치들 사이의 변형 만이 존재하고 (패치 내의 플로트는 모두 동일합니다) "순수한 의사 복제"가 있습니다 : N은 패치의 수 여야합니다. 새로운 정보. 다른 극단적 인 경우, 모든 변동은 플롯 사이에서 발생하며 각 플롯이 속하는 포리스트 패치를 알면 추가 변형이 발생하지 않습니다 (그런 다음 임의 요인이없는 모델이 더 조화로운 것처럼 보입니다). "독립적 인"도표가 있습니다. 극도의 어느 것도 일어날 가능성이 매우 적습니다. 특히 공간 자기 상관과 포유류의 지리적 분포 때문에 지상에서 관찰되는 생물학적 변수에 대해서는 더욱 그렇습니다. 나는 개인적으로 위에서 설명한 "실험적 관찰"유추를 유지하기 위해 어쨌든 디자인에 의해 요소를 유지하는 것을 선호합니다 (예를 들어, 패치가이 샘플에서 적절한 변형 소스가 아닌 경우에도). 기억하십시오 : 패치 사이의 변동이 0이라는 귀무 가설을 기각 할 증거가 샘플에 없다고해서 모집단의 변동이 0이라는 것은 아닙니다. 패치가 위에 설명 된 "실험적 관찰"유추를 유지하기 위해이 샘플에서 관련 변형 소스가 아닌 경우에도); 기억하십시오 : 패치 사이의 변동이 0이라는 귀무 가설을 기각 할 증거가 샘플에 없다고해서 모집단의 변동이 0이라는 것은 아닙니다. 패치가 위에 설명 된 "실험적 관찰"비유를 유지하기 위해이 샘플에서 관련 변형 소스가 아닌 경우에도; 기억하십시오 : 패치 사이의 변동이 0이라는 귀무 가설을 기각 할 증거가 샘플에 없다고해서 모집단의 변동이 0이라는 것은 아닙니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.