회귀 계수가 그룹화 변수에 의해 완화되는지 여부를 테스트하는 방법은 무엇입니까?


9

중재 변수 (예 : 성별)를 기준으로 두 그룹의 표본에 대해 회귀 분석을 수행했습니다. 한 세트에서 회귀의 유의성이 손실되고 다른 세트에는 남아 있는지 여부를 확인하여 중재 효과에 대한 간단한 테스트를 수행하고 있습니다.

Q1 : 위의 방법이 유효합니까?

Q2 : 제 연구의 신뢰 수준은 95 %로 설정되었습니다. 한 그룹의 경우 회귀는 .000에서 중요합니다. 다른 경우, 그것은 0.038에서 중요합니다. 그래서 저는 두 회귀 모두를 중요하게 받아 들여야하고 중재 효과가 없다는 것을 믿습니다. 회귀를 수락하면 0.01 오전에없는 것으로 판명되는 동안 중요합니다. 비슷한 인수를 받아들이는 Type I 오류가 발생합니까?

답변:


12

"중간 효과"가 두 그룹 사이의 하나 이상의 회귀 계수의 변화라고 가정 할 때 귀하의 방법은 질문을 다루지 않는 것 같습니다. 회귀 분석의 유의성 검정은 계수가 0이 아닌지 여부를 평가합니다. 두 회귀 분석에서 p- 값을 비교하면 두 표본 사이 의 계수 차이에 대해 거의 알 수 없습니다 .

대신 성별을 더미 변수로 도입 하고 관심있는 모든 계수와 상호 작용하십시오. 그런 다음 관련 계수의 중요성을 테스트하십시오.

예를 들어, 가장 단순한 경우 (하나의 독립 변수) 데이터는 튜플 의 목록으로 표현 될 수 있습니다. 여기서 는 성별이며 과 로 코딩됩니다 . 성별 의 모델 은(xi,yi,gi)gi010

yi=α0+β0xi+εi

(여기서 는 데이터를 색인화 함 ) 성별 의 모델 은 다음과 같습니다.igi=01

yi=α1+β1xi+εi

(여기서 는 데이터를 색인화합니다 ). 매개 변수는 , , 및 입니다. 오류는 입니다. 그것들이 독립적이고 제로 수단으로 동일하게 분포되어 있다고 가정 해 봅시다. 기울기 차이 ( ) 를 테스트하기위한 결합 모델 은 다음과 같이 쓸 수 있습니다.igi=1α0α1β0β1εiβ

yi=α+β0xi+(β1β0)(xigi)+εi

(여기서 설정 한 경우 때문에 모든 데이터를 통해 범위) 마지막 기간이 떨어졌을으로 첫 번째 모델을 제공, , 당신은 설정할 때 의 두 배수 결합을주고 두 번째 모델을 생성합니다 . 따라서 모델을 피팅하여 경사가 동일한 지 ( "조정 효과")를 테스트 할 수 있습니다.igi=0α=α0gi=1xiβ1α=α1

yi=α+βxi+γ(xigi)+εi

추정 조정 효과 크기 가 0 인지 테스트합니다 . 절편이 동일한 지 확실하지 않으면 네 번째 용어를 포함하십시오.γ^

yi=α+δgi+βxi+γ(xigi)+εi.

이 0이 아닌지 반드시 테스트 할 필요 는 없습니다. 관심이없는 경우 : 두 성별에 동일한 가로 채기를 요구하지 않고 두 성별에 개별 선형 맞춤을 허용하도록 포함되었습니다.δ^

이 접근법 의 주요 한계 는 오류 의 분산이 두 성별에 대해 동일 하다는 가정입니다 . 그렇지 않다면, 그 가능성을 통합해야하며 모델에 적합하도록 소프트웨어를 조금 더 연구해야하고 계수의 중요성을 테스트하는 방법에 대해 더 깊이 생각해야합니다.εi


감사합니다.이 작동 방식을 이해할 수 있습니다. 중재 변수가 여러 개인 경우이 방법이 작동합니까? 예를 들어, 지역 (농촌 / 도시), 교육 수준 (고등학교 교육 여부)? 더미 변수를 추가하고 효과를 테스트 할 수 있습니까?
전갈

1
@ whuber, 때로는 분석가가 단순히 샘플을 두 그룹으로 나누고 두 그룹에 대해 동일한 독립 변수 세트를 사용하고 계수를 정 성적으로 비교하는 기능상 유사한 상황을 겪습니다. 상호 작용 효과를 사용하는이 공식화에 대해 방금 설명한 상황의 이점이 있습니까?
Andy W

3
@Andy 비판적이거나 더 이상 사용되지 않을 의도가 없다면, 질적 방법에 대해 생각할 수있는 유일한 장점은 분석가의 이해 나 역량에 대한 요구가 없다는 것입니다. 질적 접근 방식에는 어려움이 있습니다. 예를 들어, 큰있을 수 분명 슬로프 혼자 우연히 절편 둘 사이의 차이. 계수에 대한 정 성적 평가는 이러한 상황을 실제 효과와 구별 할 수 없습니다.
whuber

1
@ whuber, 나의 초기 생각은 같았으며, 최근에 나는 단순성을위한 제안을 무시한 동료에게 동일한 제안을 주었다. 오류 차이가 두 성별에 대해 동일하다는 가정에 대한 의견은 아마도 가정이 위반되는 경우 두 가지 모델 접근 방식이 더 적절할 수 있다고 생각했습니다.
Andy W

1
@Andy 네, 그러나 다른 분산의 가능성은 비 정성 비교의 가치를 향상시키지 않습니다. 오히려, 모수 추정치의 미묘한 양적 비교를 요구할 것이다 . 예를 들어, 조잡한 (하지만 유익한) 근사치로서, 추정 된 오차 분산 및 자유도에 기초하여 CABF 또는 Satterthwaite t- 검정의 변형을 수행 할 수 있습니다. 잘 구성된 산점도를 육안으로 검사해도 회귀 계수를 비교하는 것보다 훨씬 쉽고 유익합니다.
whuber

-1

단면 데이터의 독립적 인 파도 (예 : year1, year2 및 year3을 group1 group2 및 group3으로)에 회귀 계수를 비교할 때 그룹화 변수를 조정하면 똑같이 잘 작동한다고 생각합니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.