이것은 아주 좋은 답변이있는 아주 오래된 질문이지만, 더 실용적인 관점을 다루기 위해 새로운 답변의 이점을 얻을 수 있다고 생각합니다.
고정 효과가 무작위 효과의 수준에 따라 변하지 않아야하는 경우는 언제입니까?
다른 답변에서 이미 설명한 문제를 다루지 않고 Barr et al (2013)의 "유명한"논문을 종종 "최대한 상태로 유지"라고 부르지 만 지금은 유명합니다.
Barr, DJ, Levy, R., Scheepers, C. and Tily, HJ, 2013. 확인 가설 테스트를위한 랜덤 효과 구조 : 최대로 유지하십시오. 기억과 언어의 전표, 68 (3), pp.255-278.
이 논문에서 저자들은 모든 고정 된 효과가 그룹화 요소 (무작위 가로 채기)의 수준에 따라 달라질 수 있다고 주장합니다. 그들의 주장은 상당히 매력적입니다. 기본적으로 그것들을 변화 시키지 않으면 서 모델에 제약을 가하고 있습니다. 이것은 다른 답변에 잘 설명되어 있습니다. 그러나이 접근법에는 Bates el al (2015)이 설명하는 심각한 문제가 있습니다.
베이츠, D., Kliegl, R., Vasishth, S. 및 Baayen, H., 2015. Parsimonious 혼합 모델. arXiv 프리 프린트 arXiv : 1506.04967
여기서 Bates는 lme4
R에서 혼합 모델을 맞추기위한 패키지 의 주요 저자이며, 아마도 이러한 모델에 가장 널리 사용되는 패키지 일 것입니다. 베이츠 등은 많은 실제 응용에서 데이터가 최대 랜덤 효과 구조를 지원하지 않는다는 점에 주목합니다. 종종 관련 변수에 대한 각 군집에 관측치 수가 충분하지 않기 때문입니다. 이것은 수렴하지 않거나 임의 효과에서 특이한 모델에서 나타날 수 있습니다. 이 사이트에서 그러한 모델에 대한 많은 질문이 그것을 증명합니다. 또한 Barr 등은 논문의 기초로 "잘 동작하는"임의 효과를 사용하여 비교적 간단한 시뮬레이션을 사용했다고 언급합니다. 대신 베이츠 등은 다음과 같은 접근법을 제안합니다.
우리는 (1) 랜덤 효과 구조의 분산 공분산 행렬의 차원을 결정하기 위해 PCA를 사용하고, (2) 특히 최대 모델을 맞추기위한 초기 시도가 수렴하지 않을 때 처음에 상관 매개 변수를 0으로 제한하도록 제안했습니다. 그리고 (3) 중요하지 않은 분산 성분과 관련 상관 파라미터를 모형에서 제거
같은 논문에서 그들은 또한 다음과 같이 지적합니다.
중요한 것은 수렴 실패는 추정 알고리즘의 결함 때문이 아니라 데이터가 제대로 지원하기에 너무 복잡한 모델을 적합시키려는 시도의 직접적인 결과입니다.
과:
반 보수적 인 결론으로부터 보호하기 위해 최대 모델이 필요하지 않습니다. 이 보호 기능은 데이터가 지원할 수있는 복잡성에 대한 현실적인 기대치에 따라 종합적인 모델을 통해 완벽하게 제공됩니다. 통계학에서 과학의 다른 곳에서와 마찬가지로, 파르 모니는 악덕이 아닙니다.
베이츠 외 (2015)
보다 적용되는 관점에서, 데이터 생성 프로세스, 데이터의 기초가되는 생물학적 / 물리적 / 화학적 이론이 랜덤 효과 구조를 지정하도록 분석가를 안내해야하는지 여부에 대한 추가 고려 사항이 있습니다.