"중첩 된"모델과 "중첩되지 않은"모델의 차이점은 무엇입니까?


61

계층 적 / 다중 레벨 모델에 관한 문헌에서 나는 종종 "중첩 모델"과 "중첩 모델"에 대해 읽었지만 이것이 무엇을 의미합니까? 누구든지 나에게 몇 가지 예를 들거나이 문구의 수학적 의미에 대해 말해 줄 수 있습니까?


3
상황에 따라 매우 과부하 된 용어입니다. 경고를 받았습니다.
fmark

답변:


33

중첩 대 비 중첩은 많은 것을 의미 할 수 있습니다. 중첩 디자인과 교차 디자인이 있습니다 (예 : 이 설명 참조 ). 모델 비교에서 중첩 모델이 있습니다. 중첩은 여기서 더 작은 모형의 모든 항이 더 큰 모형에서 발생 함을 의미합니다. 이것은 우도 비 검정과 같은 대부분의 모형 비교 검정을 사용하기 위해 필요한 조건입니다.

다단계 모델의 맥락에서 중첩 및 중첩되지 않은 요인에 대해 이야기하는 것이 좋습니다. 차이점은 여러 요인이 서로 어떻게 관련되어 있는지에 있습니다. 중첩 설계에서 한 요인의 수준은 다른 요인의 수준 내에서만 의미가 있습니다.

잎의 산소 생성을 측정하고 싶다고 가정 해보십시오. 여러 나무 종을 채취하고 모든 나무에서 바닥, 중간 및 나무의 일부 잎을 채취합니다. 이것은 중첩 된 디자인입니다. 다른 위치에있는 잎의 차이는 한 나무 종 내에서만 의미가 있습니다. 따라서 모든 나무의 바닥 잎, 중간 잎 및 상단 잎을 비교하는 것은 의미가 없습니다. 또는 다르게 말하면 : 잎 위치는 주요 효과로 모델링되어서는 안됩니다.

중첩되지 않은 요인은 관련이없는 두 가지 요인의 조합입니다. 환자를 연구하고 연령과 성별의 차이에 관심이 있다고 가정하십시오. 따라서 요인 연령과 관련없는 요인 성별이 있습니다. 나이와 성별을 주요 효과로 모델링해야하며 필요한 경우 상호 작용을 살펴볼 수 있습니다.

차이점이 항상 명확하지는 않습니다. 첫 번째 예에서 나무 종이 형태와 생리학에서 밀접하게 관련되어 있다면 잎 위치도 유효한 주요 효과로 간주 할 수 있습니다. 많은 경우 중첩 디자인과 중첩되지 않은 디자인의 선택은 사실보다 연구원의 결정에 달려 있습니다.


12

중첩 된 모델과 중첩되지 않은 모델이 결합 분석 및 IIA에서 나타납니다 . "빨간 버스 파란색 버스 문제"를 고려하십시오. 50 %의 사람들이 자동차를 타고 일하고 다른 50 %는 빨간 버스를 타는 인구가 있습니다. 빨간색 버스와 동일한 사양을 가진 파란색 버스를 방정식에 추가하면 어떻게됩니까? 다항 로짓 모델은 세 가지 모드에 대해 33 %의 점유율을 예측합니다. 우리는 직관적으로 빨간 버스와 파란 버스가 차보다 서로 비슷하기 때문에 이것이 정확하지 않다는 것을 알고 있습니다. 이것이 중첩 구조가 시작되는 곳이며 일반적으로 유사한 대안에서 람다 계수로 지정됩니다.

Ben Akiva는 여기에 이론을 요약 한 멋진 슬라이드 세트를 정리했습니다 . 그는 슬라이드 23 주위에 중첩 된 로짓에 대해 이야기하기 시작합니다.


10

두 번째 모델의 일부 매개 변수를 제한하여 항상 첫 번째 모델을 얻을 수있는 경우 한 모델이 다른 모델에 중첩됩니다. 예를 들어, 선형 모델 는 2도 다항식 내에 중첩됩니다. 왜냐하면 b = 0으로 설정하면 2- 도입니다. 다항식은 선형 형태와 동일하게됩니다. 즉, 선은 다항식의 특수한 경우이므로 두 개는 중첩됩니다.Y = X + B , X 2 + Cy=ax+cy=ax+bx2+c

두 모델이 중첩 된 경우의 주된 의미는 통계적으로 비교하기가 상대적으로 쉽다는 것입니다. 간단히 말해서 중첩 된 모델을 사용하면 더 단순한 "널 모델"에 무언가를 추가하여 더 복잡한 모델을 구성한 것으로 간주 할 수 있습니다. 따라서이 두 가지 모델 중에서 가장 좋은 것을 선택하려면 추가 된 것이 데이터에 상당한 양의 추가 분산을 설명하는지 여부를 찾아야합니다. 이 시나리오는 실제로 단순 모델을 먼저 피팅하고 데이터에서 예측 분산을 제거한 다음 더 복잡한 모델의 추가 구성 요소를 첫 번째 피팅의 잔차에 맞추는 것과 같습니다 (적어도 최소 제곱 추정).

중첩되지 않은 모델은 데이터에서 분산의 완전히 다른 부분을 설명 할 수 있습니다. 복잡한 모델에 간단한 모델에 포함 된 "올바른 항목"이 포함되어 있지 않은 경우 복잡한 모델은 단순한 모델보다 분산이 적을 수도 있습니다. 따라서이 경우 귀무 가설 하에서 두 모델이 모두 데이터를 똑같이 잘 설명한다는 것을 예측하기가 좀 더 어렵습니다.

더욱이, 귀무 가설 하에서 (그리고 어느 정도의 가정이 주어진 경우), 두 개의 중첩 모형 사이의 적합도 차이는 알려진 분포를 따르며, 그 형태는 두 모형 사이의 자유도 차이에만 의존합니다. 모델. 중첩되지 않은 모델에는 해당되지 않습니다.


좋은 설명.
마크

1

한 모델을 다른 모델의 한계로 얻을 수없는 경우 두 모델은 비 추정 또는 분리됩니다 (또는 한 모델이 다른 모델의 특정 사례가 아님).


1
'다른 한도'의 의미를 명확히 할 수 있습니까? 중첩 된 모델은 다른 공간과 비교하여 매개 변수 공간에 약간의 제한이있는 것으로 볼 수 있지만, 이것이 의도 한 것인지 확실하지 않습니다.
chl

예를 들어 지수 분포는 베타 형태의 매개 변수가 1이 될 때 감마 분포 (와 이블) 분포의 한계입니다.
Basilio De Bragança Pereira

1

중첩 된 모델과 중첩되지 않은 모델의 차이점에 대해 물었습니다. 보다:

중첩되지 않은 모델 또는 분리 된 모델의 주제가 처음으로 다가오는 책 또는 다음에 나오는 책 : 분리 된 또는 중첩되지 않은 모델의 선택 .


1
@BasilioDeBragancaPereira 사이트에 오신 것을 환영합니다. 독자들이 자신을 추적하고 읽을 것인지 결정할 수 있도록 해당 논문의 내용을 요약하는 것이 가장 좋습니다. 또한 OP는 "계층 / 다단계 모델"(학교에 중첩 된 클래스에 중첩 된 학생)을 지정했습니다. 이것이 당신이 말하는 문맥입니까?
gung-Monica Monica 복원

-1

이 PDF 에서 더 간단한 답변을 참조하십시오 . 기본적으로 중첩 모델은 전체 모델보다 변수가 적은 모델입니다. 한 가지 의도는 더 많은 답을 찾는 것입니다.


7
불행히도 이것은 OP가 요구하는 유형과 다른 유형의 "중첩 모델"을 설명하기 때문에 더 간단한 대답입니다. OP는 대신 계층 적 / 다단계 모델 의 맥락에서 중첩 된 모델에 대해 묻습니다 . 즉,이 답변은 자체 용어로는 정확하지만이 스레드의 맥락에서 올바르지 않습니다.
gung-모니 티 복원

링크가 끊어졌습니다.
Waldir Leoncio 2016

이 링크에는 "금지됨"이라고 표시되어 있으며 그 내용에 대해 설명하지 않습니다.
Glen_b
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.