관찰 (즉, 비 랜덤 화) 연구에서 비 독립적 공변량을 제어하는 ​​것이 얼마나 문제가됩니까?


11

Miller and Chapman (2001)은 관찰 (비 랜덤 화되지 않은) 연구에서 독립 변수와 종속 변수 둘 다와 관련된 비 독립 공변량을 제어하는 ​​것은 절대적으로 부적절하다고 주장합니다. 그렇게하는 것이 얼마나 문제가됩니까? 이 문제를 처리하는 가장 좋은 방법은 무엇입니까? 자신의 연구에서 관측 연구에서 비 독립적 공변량을 일상적으로 관리한다면 어떻게 정당화 할 수 있습니까? 마지막으로, 동료들과 방법론을 논할 때 선택해야 할 싸움입니까?

감사

Miller, GA, & JP Chapman (2001). 공분산에 대한 오해 분석. 비정상 심리학 저널, 110, 40-48. -http : //mres.gmu.edu/pmwiki/uploads/Main/ancova.pdf


"다중 공선성에 대한 직관적 인 설명" 에 대한 다음 질문 은 위의 맥락에서 도움이 될 수 있습니다.

답변:


4

상관 정도만큼 문제가됩니다.

아이러니 한 점은 변수 중 하나와 예상되는 상관 관계가 없는지 제어하지 않아도된다는 것입니다. 그리고 독립 변수가 종속 변수에 영향을 줄 것으로 예상되는 경우 반드시 두 변수와 상관 관계가 있습니다. 그러나 그것들이 서로 밀접하게 관련되어 있다면 실제 독립 또는 종속 변수를 제어하는 ​​것이 중요하기 때문에 아마도 제어해서는 안됩니다.


나는 이것이 오래된 대답이라는 것을 알고 있지만 wrt에 대한 자세한 내용이 있습니까? 첫 번째 줄, 특히 Miller & Chapman을 명시 적으로 언급하여 논의하는 줄?
jona

4

사회 과학에서 우리는 종종이 문제를 "사후 치료 편향"이라고 부릅니다. 치료 후 발생하는 변수 (인과 적 의미)를 포함하여 일부 치료 (독립 변수)의 효과를 고려하는 경우 치료 효과의 추정치가 편향 될 수 있습니다. 이러한 변수를 포함 시키면 어떤 의미에서 치료의 영향을 통제하는 것입니다. 치료 T가 결과 Y를 유발하고 다른 변수 A와 A가 Y를 유발하는 경우, A를 제어하는 ​​것은 T가 A를 통해 Y에 미치는 영향을 무시합니다.이 바이어스는 양수 또는 음수 일 수 있습니다.

사회 과학에서 A는 A를 A에게 피드백하는 T를 유발하고 A와 T는 Y를 유발할 수 있기 때문에 특히 어려울 수 있습니다. 예를 들어 GDP가 높으면 높은 수준의 민주화 (우리의 치료)로 이어질 수 있습니다. GDP 증가, GDP 증가, 민주화 증가는 정부 부패를 줄인다. GDP는 민주화를 야기하기 때문에, 우리가 통제하지 않으면, 내 생성 문제 또는 "변수 생략"이 있습니다. 그러나 우리가 GDP를 통제한다면, 치료 후 편견이 있습니다. 우리가 할 수있는 무작위 시험을 사용하는 것 외에, Scylla와 Charybdis 사이에서 우주선을 조종하기 위해 할 수있는 다른 일은 거의 없습니다. 게리 킹 (Gary King)은 하버드 (Harvard)의 "사회 과학에서 가장 어려운 미해결 문제"이니셔티브에 대한 그의 지명으로 이러한 문제에 대해 이야기 합니다 .


3

내가 알다시피, 많은 독립적 인 변수를 "통제"하는 관측 연구에는 두 가지 기본 문제가있다. 1) 설명 변수가 누락되어 모델이 잘못 지정되는 문제가 있습니다. 2) (상호 한) 설계 실험에는 존재하지 않는 여러 상관 상관 변수의 문제와 공변량의 회귀 계수 및 ANCOVA 검정이 부분을 기반으로하여 해석하기 어렵다는 사실이 있습니다. 첫 번째는 관측 연구의 본질에 내재되어 있으며 과학적 맥락과 경쟁 정교화 과정에서 다루어진다. 후자는 교육 문제이며 회귀 및 ANCOVA 모델에 대한 명확한 이해와 이러한 계수가 나타내는 것이 무엇인지에 의존합니다.

첫 번째 문제와 관련하여 일부 종속 변수에 대한 모든 영향을 알고 모델에 포함하면 통계적 제어 방법이 효과적이며 개별 변수에 대한 효과를 예측하고 예측할 수 있습니다. "부드러운 과학"의 문제는 모든 관련 영향이 거의 포함되거나 알려지지 않았기 때문에 모델이 잘못 지정되어 해석하기 어렵다는 것입니다. 그러나 이러한 영역에는 많은 가치있는 문제가 있습니다. 답은 확실하지 않다. 과학적 과정의 장점은 자기 교정 적이며 모델에 의문을 제기하고 정교하며 다듬는 것입니다. 대안은 실험을 설계 할 수 없을 때 과학적으로 이러한 문제를 조사 할 수 없다는 것을 제안하는 것입니다.

두 번째 문제는 ANCOVA 및 회귀 모델의 특성상 기술적 인 문제입니다. 분석가는 이러한 계수와 테스트가 무엇을 나타내는 지 명확하게 설명해야합니다. 독립 변수들 간의 상관은 회귀 계수 및 ANCOVA 테스트에 영향을줍니다. 그것들은 부분 테스트입니다. 이 모형은 주어진 독립 변수와 모형의 다른 모든 변수와 관련된 종속 변수의 분산을 취한 다음 해당 잔차의 관계를 조사합니다. 결과적으로, 개별 계수와 테스트는 포함 된 전체 변수 세트와 그 상관 관계에 대한 명확한 개념적 이해와 관련하여 해석하기가 매우 어렵습니다. 그러나 이것은 예측에 아무런 문제를 일으키지 않습니다. 특정 테스트와 계수를 해석 할 때는주의해야합니다.

참고 : 후자의 문제는 다른 예측자가 모형에 도입 될 때 회귀 부호의 반전 (예 : 음수에서 양수로)에 대해이 포럼에서 이미 논의한 문제와 관련이 있습니다. 상관 된 예측 변수가 존재하고 전체 예측 변수 세트 사이의 다중 및 복잡한 관계에 대한 명확한 이해가 없으면 특정 특성을 가지기 위해 (자연에 의해) 부분 회귀 계수를 예상 할 이유가 없습니다. 강한 상호 이론과 그러한 상호 관계에 대한 명확한 이해가있을 때, 그러한 "역전"이라는 표시는 깨달음이되고 이론적으로 유용 할 수 있습니다. 많은 사회 과학 문제의 복잡성을 감안할 때 충분한 이해가 흔하지는 않지만, 나는 기대할 것입니다.

면책 조항 : 저는 훈련을받은 사회 학자이자 공공 정책 분석가입니다.


2

나는 그들의 논문의 첫 페이지를 읽었으므로 그들의 요점을 오해했을 수도 있지만 그들은 기본적으로 분석에 다중 공선 독립 변수를 포함시키는 문제를 논의하고있는 것 같습니다. 그들이 나이와 학년을 예로 들어 보면이 아이디어는 다음과 같이 나타납니다.

나이는 학교의 학년과 밀접한 관련이 있으므로 나이와 관련된 농구 능력의 차이를 제거하면 학년과 관련된 농구 능력의 상당한 차이가 제거됩니다.

ANCOVA는 더미 변수로 표시되고 공변량은 회귀 방정식에서 독립 변수로 나타나는 선형 회귀입니다. 따라서, 내가 그들의 논문을 완전히 읽지 않았기 때문에 그들의 요점을 잘못 이해하지 않는 한, 그들은 다중 공선 변수를 피하는 것과 동등한 '종속 공변량을 포함하지 마십시오'라고 말하는 것 같습니다.


그들의 논증은 그 자체로 상관 된 변수가 아니라 사실상 서로 분리 될 수없는 변수에 관한 것이다. "이것이 없으면 의미가 없습니다"라고 거의 말할 수있는 변수입니다. 통계적으로 평가할 수있는 상관 정도가 아니라 문제는 개념적으로 해결해야합니다. 나이를 늘리지 않고도 성적을 올릴 수 있습니까? 거의. 불안이 증가하지 않으면 우울증이 심화 될 수 있습니까? 더 힘들어요.
rolando2

1

(가장 큰) 문제는 그룹 변수와 공변량이 방정식의 예측 측에 함께 있기 때문에 그룹 변수는 더 이상 그룹 변수가 아니라는 것입니다. 공변량이 부분적으로 분리 된 변수이므로 더 이상 연구하고 있다고 생각한 그룹 변수로 인식하거나 해석 할 수 없습니다. 큰 문제입니다.

핵심 내용은 45 페이지의 "ANCOVA는"그룹 "에서 의미있는 분산을 제거하고, 그룹이 나타내는 구성과 불확실한 관계로 특성화되지 않은, 잔차 잔류 그룹 변수를 남깁니다."

현재 솔루션은 DV에서 공변량을 부분적으로 분할 한 다음 ANCOVA를 사용하는 대신 DV 잔차를 일반 ANOVA에 제출하는 것입니다.


2
그러나 그것은 ancova와 동일합니까?!

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.