연구원이나 데이터 분석가가 주관적인 선택이라는 뉘앙스가 있고 아마도 불만족스러운 대답을 할지도 모른다. 이 스레드의 다른 곳에서 언급했듯이 데이터에 "중첩 구조"가 있다고 말하는 것만으로는 충분하지 않습니다. 그러나 공평하게 말하면, 이것은 다중 레벨 모델을 사용하는시기를 설명하는 책의 수입니다. 예를 들어, Joop Hox의 책 Multilevel Analysis 를 책장에서 가져 와서 다음과 같은 정의를 제공합니다.
다단계 문제는 계층 구조를 가진 모집단과 관련이 있습니다.
아주 좋은 교과서에서도 초기 정의는 원형으로 보입니다. 나는 이것이 어떤 종류의 모델 (다단계 모델 포함)을 언제 사용해야하는지 결정하는 주관성 때문이라고 생각합니다.
West, Welch 및 Galecki의 Linear Mixed Models 라는 또 다른 책 은 이러한 모델이 다음과 같은 것이라고 말합니다.
잔차가 정규 분포를 따르지만 독립적이지 않거나 분산이 일정하지 않은 결과 변수. LMM을 사용하여 적절하게 분석 할 수있는 데이터 세트로 이어지는 연구 설계에는 (1) 교실 학생과 같은 군집 데이터를 사용한 연구 또는 산업 공정을위한 원료 배치와 같은 임의 블록을 사용한 실험 설계 및 (2)가 포함됩니다. 시간이 지남에 따라 또는 다른 조건에서 대상을 반복적으로 측정하는 종단 또는 반복 측정 연구.
R 의 Finch, Bolin 및 & Kelley 's Multilevel Modeling은 또한 iid 가정 및 상관 잔차를 위반하는 것에 대해 이야기합니다.
다단계 모델링의 맥락에서 특히 중요한 것은 표본 내 개별 관측치에 대해 독립적으로 분포 된 오차 항의 가정 (표준 회귀)입니다. 이 가정은 본질적으로 분석의 독립 변수가 고려되면 종속 변수에 대한 표본의 개체 간 관계가 없음을 의미합니다.
나는 관측치가 반드시 서로 독립적 일 필요는 없다고 믿을만한 근거가있을 때 다단계 모형이 의미가 있다고 믿는다. 이 비 독립성을 설명하는 "클러스터"가 무엇이든 모델링 할 수 있습니다.
명백한 예는 교실에있는 어린이들입니다. 그들은 모두 서로 상호 작용하여 시험 점수가 독립적이지 않을 수 있습니다. 한 학급에 다른 학급에서 다루지 않은 자료가 해당 학급에서 다루어 질 수있는 질문을하는 사람이 있다면 어떻게 될까요? 선생님이 다른 수업보다 일부 수업에 대해 더 깨어 있다면? 이 경우 데이터와 무관 한 데이터가있을 수 있습니다. 다단계 단어에서, 종속 변수의 일부 차이는 클러스터 (예 : 클래스)에 기인 할 수 있습니다.
개 대 코끼리의 예는 독립적이고 의존적 인 관심 변수에 달려 있다고 생각합니다. 예를 들어, 카페인이 활동 수준에 미치는 영향을 묻고 있다고 가정 해 봅시다. 동물원 곳곳에서 온 동물들은 무작위로 카페인 음료 나 통제 음료를 받도록 배정됩니다.
우리가 카페인에 관심이있는 연구원이라면, 카페인의 영향에 정말로 신경을 쓰므로 다단계 모델을 지정할 수 있습니다. 이 모델은 다음과 같이 지정됩니다.
activity ~ condition + (1+condition|species)
이 가설을 테스트 할 종이 많을 경우 특히 유용합니다. 그러나 연구원은 카페인의 종별 영향에 관심이있을 수 있습니다. 이 경우 종을 고정 효과로 지정할 수 있습니다.
activity ~ condition + species + condition*species
예를 들어 30 종이있어 다루기 어려운 2 x 30 디자인을 만드는 경우에는 분명히 문제가됩니다. 그러나 이러한 관계를 모델링하는 방법으로 창의력을 발휘할 수 있습니다.
예를 들어, 일부 연구자들은 다단계 모델링의 광범위한 사용을 주장하고 있습니다. Gelman, Hill, & Yajima (2012) 는 데이터의 구조가 본질적으로 계층 적이 지 않은 실험 연구에서도 다중 레벨 모델링이 다중 비교를위한 수정으로 사용될 수 있다고 주장합니다.
더 많은 구조를 가진 다중 비교를 모델링 할 때 더 어려운 문제가 발생합니다. 예를 들어, 5 개의 성과 측정, 3 가지 종류의 치료 및 2 개의 성별과 4 개의 인종 그룹으로 분류 된 하위 그룹이 있다고 가정합니다. 이 2 × 3 × 4 × 5 구조를 120 개의 교환 가능한 그룹으로 모델링하고 싶지 않습니다. 이처럼 복잡한 상황에서도 다중 레벨 모델링은 고전적인 다중 비교 절차를 대신해야한다고 생각합니다.
문제는 다양한 방식으로 모델링 될 수 있으며, 모호한 경우 여러 접근 방식이 매력적으로 보일 수 있습니다. 우리의 임무는 합리적이고 정보에 입각 한 접근 방식을 선택하고 투명하게하는 것입니다.