다중 회귀 분석이 실제로 공변량을 얼마나 잘“제어”할 수 있습니까?


45

우리는 다중 무작위 회귀 모델에 상상할 수있는 모든 잠재적 혼란자를 포함시켜 비 랜덤 화되지 않은 예측 변수 X와 결과 사이의 인과 관계를 확립하려는 관찰 연구에 익숙합니다. 따라서 모든 혼란 자들을“통제”함으로써 우리는 관심있는 예측 인자의 효과를 분리시킨다.

나는 주로 통계 수업의 다양한 교수들이 만든 비공식적 발언을 바탕 으로이 아이디어로 점점 불편을 겪고 있습니다. 그들은 몇 가지 주요 범주에 속합니다.

1. 생각하고 측정하는 공변량 만 제어 할 수 있습니다.
이것은 명백하지만 실제로 그것이 가장 치명적이고 극복 할 수 없는지 궁금합니다.

2. 그 접근법은 과거에 추악한 실수를 야기했다.

예를 들어 Petitti & Freedman (2005)은 수십 년 동안 통계적으로 조정 된 관찰 연구가 어떻게 호르몬 대체 요법이 심장 질환 위험에 미치는 영향에 대해 비참하게 잘못된 결론을 내 렸는지 논의합니다. 이후의 RCT는 거의 반대의 효과를 발견했습니다.

3. 공변량을 제어 할 때 예측 변수 결과 관계가 이상하게 작동 할 수 있습니다.

Yu-Kang Tu, Gunnell, & Gilthorpe (2008) 는 Lord 's Paradox, Simpson 's Paradox 및 억제 변수를 포함한 몇 가지 다른 표현에 대해 논의합니다.

4. 단일 모형 (다중 회귀)이 공변량을 적절히 조정하고 동시에 예측 변수 결과 관계를 모델링하는 것은 어렵습니다.

나는 이것이 성도 점수와 혼란 자에 대한 층화와 같은 방법의 우수성에 대한 이유라고 들었지만 실제로 그것을 이해하고 있는지 확실하지 않습니다.

5. ANCOVA 모델은 공변량과 관심있는 예측 변수가 독립적이어야합니다.

물론, 우리는 그들이 관심있는 예측 자와 상호 연관되어 있기 때문에 교란 자들을 정확하게 조정하므로, 우리가 그것을 원할 때 정확한 경우에 모델이 성공하지 못하는 것 같습니다. 인수는 무작위 시험에서 소음 감소에만 적합하다고 주장한다. Miller & Chapman (2001) 은 훌륭한 리뷰를 제공합니다.

그래서 내 질문은 :

  1. 이러한 문제와 내가 알지 못하는 다른 문제는 얼마나 심각합니까?
  2. "모든 것을 통제하는"연구를 볼 때 얼마나 두려워해야합니까?

(이 질문이 토론 영역으로 너무 많이 퍼지지 않기를 바라며 개선을위한 제안을 행복하게 보내시기 바랍니다.)

편집 : 새로운 참조를 찾은 후 포인트 5를 추가했습니다.


1
2 번 문제는 '모든 것에 대한 통제'가보다 일반적인 사양 문제라고 생각합니다. 파라 메트릭 모델이 올바르게 지정된 상황을 생각하는 데 문제가 있습니다. 즉, 모델은 현실을 단순화하며,이 유형의 연구 기술이 놓여있는 곳입니다. 연구원은 모델에서 무엇이 중요하지 않은지를 결정해야합니다.
kirk

4
이 질문으로 당신은 저를 팬으로 만들었습니다.
rolando2

1
나는 이것이 매우 좋은 점을 제기한다고 생각한다. 그러나 대답은 엄격하게 통계적인 영역 밖에 있다고 생각합니다. 따라서 1) 복제 된 경우 2) 실질적으로 실행 가능한 경우 등 모든 통계적 결과가 더 중요합니다. 또한 MAGIC 기준 및 Abelson의 일반적인 주장을 참조하십시오 .
Peter Flom-Monica Monica 복원

1
포인트 # 5는 절대로 거짓입니다. Miller & Chapman 용지가 완전히 잘못되었습니다.
Jake Westfall

1
@ half-pass 논문의 중심 주장, 즉 초점 예측 변수 X와 공변량 C는 상관이 없어야한다는 것 외에 다른 말을하는 것이 확실하지 않습니다. ANCOVA는 단지 회귀 모델이므로이 동일한 추론은 거의 모든 실제 다중 회귀 사용을 무효화 할 것입니다! 몇 개월 전에이 끔찍한 논문에 대한 트위터 토론이있었습니다 : twitter.com/CookieSci/status/902298218494644228
Jake Westfall

답변:


4

공변량에 대해 실제로 통제하고 있다고 주장하기 위해 어떤 가정을해야 하는가?

이것은 Judea Pearl의 인과 관계 그래프로 수행 할 수 있으며 미적분학을 수행 할 수 있습니다 .

그의 웹 사이트에 http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf 및 기타 자료를 참조 하십시오 .

통계 학자로서 우리는 모든 모형이 틀렸다는 것을 알고 있으며, 실제 통계 학적 질문은 우리의 대답이 거의 괜찮을 정도로 잘못 판단되지 않은 것으로 추정되는 것입니다. 펄이 인식하고 방지하기 위해 자주 그의 작품에 대해 논의하지만, 아마도하지 명시 적으로 않는 flustrating 답변 가지고 자신의 주장에 많은 통계 (나는 그의의 경우와 믿는 가정이 만드는 하나 개의 필요가 무엇을? ).

(현재 ASA는 통계 방법에 이러한 방법을 포함시키는 교재를 제공하는 상을 제공하고 있습니다 )


우아한 그래픽 표현에 대한 훌륭한 참조, 감사합니다.
반 패스

0

질문 1에 대한 답변 :

  • 심각성의 정도는 상황에 따라 가장 잘 평가됩니다 (즉, 유효성에 기여하는 모든 요소를 ​​고려해야합니다).
  • 심각도를 범주 적으로 평가 해서는 안됩니다. 예를 들어 연구 설계에 대한 추론 계층 구조 개념이 있습니다 (예 : 사례 보고서가 가장 낮고 RCT가 범주 적으로 가장 높음). 이러한 유형의 체계는 의대에서 양질의 증거를 신속하게 식별하는 쉬운 휴리스틱으로 자주 학습됩니다. 이러한 유형의 사고의 문제점은 그것이 알고리즘적이고 현실적으로 지나치게 결정 론적이며 그 대답 자체가 과소 결정 된다는 것입니다 . 이런 일이 발생하면 잘 설계된 RCT가 잘 설계된 관찰 연구보다 나쁜 결과를 얻을 수있는 방법을 놓칠 수 있습니다.
  • 전염병 학자의 관점에서 위의 요점에 대한 전체 토론은이 읽기 쉬운 검토를 참조하십시오 (Rothman, 2014) .

질문 2에 대한 답변 :

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.