그룹 비교를위한 상호 작용 항과 별도의 회귀 분석을 사용한 공동 모형


13

이전 질문과 토론에서 귀중한 피드백을 수집 한 후 다음과 같은 질문을 제기했습니다. 예를 들어 남성과 여성의 두 그룹에서 효과 차이를 감지하는 것이 목표라고 가정합니다. 이를 수행하는 두 가지 방법이 있습니다.

  1. 두 그룹에 대해 두 개의 개별 회귀 분석을 실행하고 Wald 검정을 사용하여 귀무 가설 : 을 기각 (또는 거부)합니다 . 여기서 은 남성 회귀 분석에서 하나의 IV 계수이고 는 동일한 계수입니다. 여성 회귀의 IV.b 1 - b 2 = 0 b 1 b 2H0b1b2=0b1b2

  2. 두 그룹을 함께 모으고 성별 더미와 상호 작용 항 (IV * genderdummy)을 포함시켜 공동 모델을 실행합니다. 그런 다음 그룹 효과의 감지는 상호 작용의 부호와 유의성에 대한 t- 검정을 기반으로합니다.

(1)의 경우 Ho가 기각되는 경우, 즉 그룹 차이는 유의하지만, (2)의 경우 상호 작용 계수 항은 통계적으로 중요하지 않습니다. 즉, 그룹 차이는 중요하지 않습니다. 또는 그 반대의 경우에는 (1)의 경우 Ho가 거부되지 않으며 (2)의 경우 상호 작용 항이 중요합니다. 나는이 결과를 여러 차례 마쳤으며, 어떤 결과가 더 신뢰할 만한지, 그리고이 모순의 원인이 무엇인지 궁금했습니다.

많은 감사합니다!


1
절차의 차이점은 두 그룹에 대해 동일한 분산을 가정한다는 것입니다. 별도의 분석은 다른 분산을 가정합니다.
확률 론적

고마워요! 다른 모델을 비교할 때 분산 문제를 논의하는 참조를 알고 계십니까?
Bill718

답변:


7

첫 번째 모델은 성별을 모델의 다른 모든 공변량과 완전히 상호 작용합니다. 본질적으로, 각 공변량의 효과 (b2, b3 ... bn). 두 번째 모델에서 성별의 효과는 IV 와만 상호 작용합니다. 따라서 IV 및 성별보다 공변량이 더 많다고 가정하면 결과가 약간 다를 수 있습니다.

공변량이 두 개인 경우 Wald 검정과 우도 비율 검정 간의 최대화 차이가 다른 해답으로 이어지는 경우가 문서화되어 있습니다 ( wikipedia에서 자세한 내용 참조 ).

내 경험상, 나는 이론의 인도를 받으려고 노력한다. 성별이 IV 와만 상호 작용하고 다른 공변량과는 상호 작용하지 않는다고 주장하는 지배적 인 이론이 있다면, 부분 상호 작용과 함께 갈 것입니다.


감사! 네, 실제로 하나의 IV뿐만 아니라 다양한 공변량이 있습니다. 저는 단순성에 대한 질문에서 하나의 IV를 언급했습니다. 문제는 성별과 특정 공변량 사이의 상호 작용을 뒷받침 할 수있는 강력한 이론이 없으며 탐색 적 분석이므로 많은 상호 작용과 모형 적합을 실험해야한다는 것입니다. 초기 모델에는 30 개의 예측 변수가 포함되어 있습니다.
Bill718

@ Bill718 또한 상호 작용이 아닌 성별을 추가 IV로 지정하지 않는 한, 별도의 모델은 다른 인터셉트를 갖지만 단일 모델은 그렇지 않습니다.
Robert Kubrick

5

두 가지 다른 절차를 사용하여 특정 가설을 테스트 할 때마다 다른 p- 값이 존재합니다. 하나는 중요하고 다른 하나는 0.05 수준에서 흑백 결정을 내릴 수는 없습니다. 한 테스트에서 p- 값이 0.03이고 다른 테스트가 0.07이라고 말하면 결과를 모순하지 않습니다. 중요성에 대해 엄격히 생각한다면, 이사회의 중요성이있을 때 상황 (i) 또는 (ii)가 발생하기 쉽습니다.

이전 질문에 대한 답변으로 언급했듯이 상호 작용을 찾는 것에 대한 선호는 하나의 결합 회귀를 수행하는 것입니다.


예, 적어도 내 경우에는 결합 회귀가 더 잘 수행되는 것처럼 보이고 누군가가 다른 상호 작용 및 모델 적합으로 시도 할 수 있기 때문에 매우 유연한 방법이라는 것이 사실입니다. , 어떻게 든 다른 결과 뒤에 이유가 무엇인지 찾기 위해. p- 값과 관련하여, 일부 사람들은 a = 0.5 % 수준 이하에서만 중요성을 받아들이는 것을 들었습니다. 나는 1 % 수준을 사용하여 더 유연하지만 p- 값이 완전히 다른 경우 큰 두통이옵니다.
Bill718

예를 들어 정렬 된 로짓 모더를 사용할 때 하나의 IV가 매우 중요하고 OLS가 적용될 때 동일한 IV가 중요하지 않은 연구가 있습니다. 따라서이 경우 결과에 대한 설명이 약간 까다로울 수 있습니다. 귀하의 의견과 피드백에 감사드립니다!
Bill718

0.070.03

2

두 번째 경우, 표준 소프트웨어는 t- 학생 p 값이있는 t-stat를 제안하지만 첫 번째 경우 Wald 테스트에는 두 가지 옵션이있을 수 있습니다. 오차 정규성 가정 하에서 Wald 통계는 정확한 Fisher 통계를 따릅니다 (이는 오차의 정규성을 가정 할 때 t-stat와 같습니다). 점근 적 정규성 하에서 Wald 통계는 Chi2 분포를 따릅니다 (무조건 정규 분포를 따르는 t-stat와 유사) 어떤 분포를 가정하고 있습니까? 이에 따라 p- 값이 다른 결과를 초래할 위험이 있습니다.

교과서에는 양측 단일 시험 (하나의 매개 변수)에 대해 t- 학생 및 Fisher 통계가 동일하다는 것을 알 수 있습니다.

표본이 크지 않은 경우 chi2와 t-stat pvalue를 비교하면 특정 결과가 다릅니다. 이 경우 점근 적 배분을 가정하는 것이 합리적이지 않을 것입니다. 표본이 다소 작 으면 정규성이 더 합리적이라고 가정하면 각각 사례 2와 1에 대한 t-stat 및 Fisher pvalue를 의미합니다.


실제로, 나는 크기가 다른 두 개의 표본을 가지고 있는데, 첫 번째는 3000 개의 관측치를 가지고 있지만 두 번째는 상대적으로 작은 500 개의 관측치입니다. 그리고 소프트웨어는 Wald 통계를 계산할 때 카이 제곱을보고합니다. 따라서 이것이 불일치의 이유 인 것 같습니다. 두 샘플은 일반적으로, 특히 큰 샘플의 경우에 정상적으로 분포됩니다. 많은 감사합니다!
Bill718

1
미안하지만 하위 샘플 크기가 다르면 문제가되지 않습니다. 또한 당신은 나에게 큰 샘플처럼 보입니다. 두 절차 모두 비슷한 결과를 가져옵니다. @probabilityislogic이 좋은 지적을 한 것으로 나타났습니다. 하나의 풀링 된 샘플을 사용하는 것은 동일한 잔차 분산을 의미하므로 이질성의 원인이 될 수 있습니다. 별도의 회귀 절차를 구현하는 방법을 모르지만 통계를 직접 계산하는 경우 실수를 저지르기 쉽습니다. 이것은 풀링 된 회귀를 안전한 직접 접근 방식으로 만듭니다.
JDav

1
그룹 간 (이질 체적) 불균형 분산 문제를 해결하려면 백색 (일명 Newsta-West, Sandwich 또는 Rosta)을 사용하여 분산 추정기를 시도하십시오. 이 방법은 알 수없는 유형의 이분산성을 수정합니다.
JDav

오, 알겠습니다. 실제로 표본의 관측치는 국가의 다른 지역에서 나온 것이므로 이질성 문제가있을 가능성이 매우 높습니다!
Bill718
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.