변수의 일치 및 통계적 제어와 같은 방법 사이의 연관성은 무엇입니까?


10

종종 연구 기사에서 연구원들이 특정 변수에 대해 통제했다고 읽습니다. 일치, 차단 등의 방법으로 수행 할 수 있습니다.

그러나 항상 변수에 대한 제어는 영향을 줄 수있는 몇 가지 변수를 측정하고 변수에 대한 통계 분석을 수행하여 실제 실험과 준 실험에서 모두 수행 할 수있는 것으로 생각했습니다. 예를 들어, 독립 변수와 일부 혼란스러운 변수를 측정하고 분석하는 측량 또는 기타 테스트가 있습니다.

  • 유사 실험에서 변수를 제어 할 수 있습니까?
  • 변수의 일치 및 통계적 제어와 같은 방법 사이의 연관성은 무엇입니까?

답변:


6

AdamO와 마찬가지로,이 질문에 대답하는 열쇠는 인과 추론의 개념과 관찰 설정을 사용하여 인과 모델을 "가져 오는"방법이라고 생각합니다.

완벽한 세상에서, 우리는 반 인구 집단 이라는 연구 대상을 가질 것입니다 . 연구 모집단은 우리가 관심이있는 것을 제외하고 모든면에서 동일합니다. 그 차이에 근거한 두 집단의 차이는 진정한 인과 적 결과입니다.

분명히, 우리는 이것을 가질 수 없습니다.

그러나 가까이 접근하는 방법이 있습니다.

  • 무작위 배정 : 이론적으로 (무작위 배정이 올바르게 수행 된 경우) 무작위 배정 후 치료를 제외하고 동일한 두 모집단을 제공해야합니다.

  • 계층화 : 공변량 수준 에서 모집단을 볼 수 있습니다 . 이것은 적은 수의 레벨에서 훌륭하게 작동하지만 빠르게 번거 롭습니다.

  • 매칭 : 매칭은 그룹 A가 그룹 B와 유사하도록 연구 모집단을 모으려는 시도이므로 비교할 수있다.

  • 통계 조정 : 회귀 모델에 공변량을 포함하면 공변량 수준 내에서 효과를 추정 할 수 있습니다. 다시 말하면, 유사와 비교하거나 적어도 시도합니다.

모두 그 반 인구에 접근하려는 시도입니다. 그것을 가장 잘 얻는 방법은 나가고 싶은 것과 연구 결과에 따라 다릅니다.


훌륭한 설명. 훨씬 더 간결하고 더 나은 원래 질문을 해결합니다. 이 방법들을 추가해 보도록하겠습니다. 통계적 조정 만이 빈 지층을 갖는 문제에는 영향을 미치지 않습니다. 사례 관리 연구에서 연령에 따라 인구를 계층화하려는 경우, 연령에 따른 일치, 계층화 및 (차단) 무작위 화에는 50 세의 사례를 51 세의 대조군과 비교하기 위해 조 대화 또는 비닝이 필요합니다.
AdamO

그러나 로지스틱 회귀 분석에서는 연속 정보를 사용하여 선형 또는 기본 스플라인 조정 연령과 같이 그룹간에 정보를 암시 적으로 빌려서 비교할 수 있습니다. 따라서 회귀 모델링은 가장 강력하고 유용한 통계 방법 중 하나가됩니다.
AdamO

@AdamO Agreed-위의 질문에 대한 대답에서 정보 부족이 우연과 비닝으로 인한 한 정보가없는 영역을 부드럽게하는 데 사용할 수 있다고 언급했습니다. 그러나 그렇습니다-회귀가 굉장한 이유가 있습니다.
Fomite

2

인과 모델링이이 질문에 답하는 열쇠라고 생각합니다. 처음 에는 데이터를보기 전에 올바른 조정 / 성형 / 제어 된 관심 효과를 식별하기 위해 직면 합니다. 성인의 키 / 폐 용량 관계를 추정하려면 흡연이 성장을 방해하고 폐 용량에 영향을 미치기 때문에 흡연 상태를 조정합니다. 혼동자는 관심있는 예측 변수와 인과 관계가 있고 관심있는 결과와 관련된 변수입니다. 유대 진주의 인과성, 2 판 참조. 데이터 수집 프로세스가 합리적인 탐색 논리와 이전 탐색 연구의 사전 지식을 사용하기 전에 올바른 혼란 변수에 대한 분석을 지정하고 강화해야합니다.

그러나 이것이 일부 연구자들이 조정 변수를 선택하기 위해 데이터 기반 방법에 의존하지 않는다는 것을 의미하지는 않습니다. 나는 확인 분석을 할 때 실제로 이것을하는 것에 동의하지 않습니다. 여러 조정 모델에 대한 모델 선택의 몇 가지 일반적인 기술은 최소한 그럴듯하다고 생각되는 모델 클래스로 제한 할 수있는 정방향 / 역방향 모델 선택입니다. 이에 대한 블랙 박스 AIC 선택 기준은 의 감소 가능성과 관련이 있습니다.R2이러한 조정 변수에 대한 선형 모형의 경우 역학에서 일반적인 또 다른 과정은 변수가 주 효과의 추정치 (확률 또는 위험 비율과 같은)를 10 % 이상 변경 한 경우에만 모형에 추가되는 것입니다. 이것이 AIC 기반 모델 선택보다 "정확한"것이지만, 여전히이 접근 방식에는 큰주의 사항이 있다고 생각합니다.

내 추천은 가설의 일부로 원하는 분석을 미리 지정하는 것입니다. 연령 조정 흡연 / 암 위험은 다른 매개 변수이며, 통제 된 연구에서 조악한 흡연 / 암 위험과는 다른 추론으로 이어집니다. 주제 지식을 사용하는 것은 회귀 분석에서 조정을위한 예측 변수를 선택하거나 실험 및 준 실험 설계의 다양한 다른 유형의 "제어 된"분석에서 계층화, 일치 또는 가중 변수로 예측자를 선택하는 가장 좋은 방법입니다.


2

일치와 회귀의 관계에 대한 이야기는 여기 블로그 게시물에 간략하게 요약되어 있습니다 . 한마디로

"D에 대한 회귀 [치료 지표]는 X [공변량]에 대한 전체 모형 (즉, 포화) 모델의 집합입니다. D의 효과 추정 결과는 X에 대한 일치와 동일하며, 분산에 의한 공변량 셀에 대한 가중치입니다. X "에 조건부 처리

회귀가 암시 적으로 제공하는 X 가중치가 주어진 D의 장단점을 포함하여 철저한 논의를 위해 대부분 무해한 계량 경제학 3.3 절 또는 반제품 및 인과 추론 5.3 절을 참조하십시오 .

@EpiGrad는 첫 번째 질문에서 좋은 시작을 제공합니다. 위에 링크 된 책들은 거의 독점적으로 취급합니다. 컴퓨터 과학 / 수학 배경이 없다면 Pearl 열심히 노력할 것입니다 (결국 가치가 있지만!)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.