동일한 데이터 세트에서 두 개의 선형 모델을 실행할 수 있습니까?


10

여러 그룹 (선별 그룹이 선험적으로 정의 됨)이있는 선형 회귀 분석의 경우 다음 두 질문에 답하기 위해 동일한 데이터 세트에서 두 개의 서로 다른 모델을 실행할 수 있습니까?

  1. 각 그룹에 0이 아닌 기울기와 0이 아닌 절편이 있으며 그룹 회귀 내에서 각각에 대한 매개 변수는 무엇입니까?

  2. 그룹 멤버쉽에 관계없이 0이 아닌 추세와 0이 아닌 인터셉트가 있으며 그룹 회귀에서이 매개 변수의 매개 변수는 무엇입니까?

R에서 첫 번째 모델은 lm(y ~ group + x:group - 1)추정 계수가 각 그룹의 절편 및 기울기로 직접 해석 될 수 있도록 두 번째 모델은이고 두 번째 모델은입니다 lm(y ~ x + 1).

대안은 lm(y ~ x + group + x:group + 1)그룹 기울기 및 절편이 일부 참조의 기울기와 차분의 차이로부터 계산되어야하는 복잡한 계수 요약 표를 생성하는 것입니다. 또한 마지막 그룹 차이 (때로는)에 대한 p- 값을 얻으려면 어쨌든 그룹을 재정렬하고 모델을 다시 실행해야합니다.

두 개의 개별 모델을 사용하는 것이 어떤 식 으로든이 표준 관행에 부정적인 영향을 미칩니 까?

이것을 문맥에 적용하기 위해 x를 약물 복용량으로, 그룹을 다른 종족으로 간주하십시오. 의사의 특정 종족에 대한 용량-반응 관계를 아는 것이 흥미로울 수도 있고, 약물이 효과가있는 종족도 아는 것이 흥미로울 수도 있지만 때로는 전체 (인간) 인구에 대한 용량-반응 관계를 아는 것도 흥미로울 수 있습니다. 공중 보건 공무원의 인종에 관계없이 이것은 그룹 내 및 그룹 회귀에 대해 개별적으로 관심을 가질 수있는 방법의 예일뿐입니다. 선량-반응 관계가 선형이어야하는지 여부는 중요하지 않습니다.


선형 회귀를 사용 하시겠습니까? 선량-반응 관계는 실질적인 선량 범위에서 거의 선형 적이 지 않다.
Michael Lew

@Michael, 죄송합니다. 예를 잘못 선택했습니다. 나는 이것에 대해 일반적으로 궁금합니다. 선량-반응 관계의 세부 사항은 방해가되지 않아야한다. 이것을 기록하기 위해 질문을 편집했습니다.
Jdub

랜덤 절편, 랜덤 슬로프 모델을 고려 했습니까?
정상적인

답변:


2

첫 번째 질문과 첫 번째 R 모델이 서로 호환되지 않는다고 생각하는 것으로 시작하겠습니다. R에서 -1또는 로 수식을 작성할 때 +0절편을 억제합니다. 따라서, lm(y ~ group + x:group - 1) 방지 절편은 크게 다음과 같은 두 가지 모델, 같은 맥락에서 0과 다를 경우 말할 수있는에서 당신은, 일이 +1절편이 자동으로 R. 난 당신이 사용하는 권합니다 추정되고, 불필요 코딩 참조 셀 ( 그룹을 나타 내기 위해 '더미 코딩'이라고도합니다. 즉, 그룹을 사용하여 만듭니다.1새 변수의 경우 하나의 그룹을 기본값으로 선택하고 각 새 변수에서 해당 그룹의 단위에 0을 지정하십시오. 그런 다음 각 새 변수는 다른 그룹 중 하나의 구성원 자격을 나타내는 데 사용됩니다. 주어진 그룹에 속하는 단위는 해당 변수에서 1로 표시되고 다른 곳에서는 0으로 표시됩니다. 계수가 반환 될 때 절편이 '유의 한'경우 기본 그룹에 0이 아닌 절편이 있습니다. 불행하게도, 다른 그룹에 대한 표준 유의성 검정은 0과 다른지 아닌 기본 그룹과 다른지를 알려줍니다. 이들이 0과 다른지 여부를 확인하려면 계수를 절편에 추가하고 합계를 표준 오류로 나누어 t- 값을 얻습니다. 기울기가있는 상황은 비슷합니다. 즉, 의 테스트엑스기본 그룹의 기울기가 0과 크게 다른지 여부를 알려주고 해당 그룹의 기울기가 기본 그룹과 다른지 여부를 알려줍니다. 0에 대한 다른 그룹의 기울기에 대한 테스트는 절편과 마찬가지로 구성 할 수 있습니다. 그룹 표시기 변수 또는 교호 작용 항없이 '제한된'모델을 맞추고로 전체 모델에 대해이 모델을 테스트하면 anova()그룹이 의미가 다른지 여부를 알 수 있습니다.

이런 것들이 말되었지만, 당신의 주된 질문은이 모든 일을 받아 들일 수 있는지의 여부 입니다. 여기서 근본적인 문제는 다중 비교 문제입니다 . 이것은 많은 의견을 가진 오래되고 가시적 인 문제입니다. ( 이 키워드로 태그가 지정된 질문 을 살펴보면 CV에서이 주제에 대한 자세한 정보를 찾을 수 있습니다 .)이 주제에 대한 의견은 확실히 다양하지만, 분석이 직교하는 한 동일한 데이터 세트에 대해 많은 분석을 실행한다고해서 아무도 당신을 비난하지 않을 것입니다. . 일반적으로 직교 대비 는 그룹 집합 을 서로 비교하는 방법을 이해하는 맥락에서 생각됩니다.그러나 여기서는 그렇지 않습니다. 당신의 질문은 드문 일입니다. 내가 알 수 있듯이 데이터 세트를 개의 개별 하위 세트로 분할 하고 각기 적절한 회귀 모델을 실행하려는 경우 간단합니다. 더 흥미로운 질문은 '붕괴 된'분석이 일련의 개별 분석과 직교로 간주 될 수 있는지 여부입니다. 그룹 분석의 선형 조합으로 축소 된 분석을 재현 할 수 있어야하기 때문에 그렇게 생각하지 않습니다.

약간 다른 질문은 이것이 실제로 의미가 있는지 여부입니다. 초기 분석을 실행하고 그룹이 실질적으로 의미있는 방식으로 서로 다르다는 것을 발견 한 이미지. 이 분기 그룹을 불완전한 전체로 만드는 것은 어떤 의미가 있습니까? 예를 들어, 그룹이 인터셉트에서 (어떻게) 다른지, 적어도 일부 그룹 에는 0 인터셉트 가 없다고 가정하십시오 . 이러한 그룹이 하나만있는 경우 해당 그룹에서 해당 그룹의 경우 전체에 대한 절편은 0 만됩니다 . 또는 하나의 양수와 하나의 음수를 갖는 0이 아닌 절편을 갖는 정확히 2 개의 그룹이 있다고 가정하면=0이 그룹들 중 하나는 절편의 발산의 크기에 반비례한다. 나는 여기에 갈 수 있지만 (더 많은 가능성이 있습니다) 요점은 그룹 크기가 매개 변수 값의 차이와 어떻게 관련이 있는지에 대한 질문입니다. 솔직히, 이것들은 나에게 이상한 질문입니다.

위에서 설명한 프로토콜을 따르는 것이 좋습니다. 즉, 그룹을 더미 코드화하십시오. 그런 다음 모든 인형과 교호 작용 항이 포함 된 전체 모형을 적합합니다. 이 항이없는 축소 모형을 적합하고 내포 모형 검정을 수행하십시오. 어떻게 든 다를 수행 그룹에 (희망) 선험적 (이론적으로 구동) 직교 대조 후속하면 더 잘 이해 하는 방법 그룹이 다릅니다. (그리고 플롯-항상, 항상 플롯하십시오.)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.