인과 관계에 대한 통계 모델은 무엇을 말할 수 있습니까? 통계 모델에서 인과 추론을 할 때 고려해야 할 사항은 무엇입니까?
가장 먼저 확인해야 할 것은 순전히 통계 모델에서 인과 적 추론을 할 수 없다는 것입니다. 인과 적 가정이없는 인과 관계에 대한 통계 모델은 없다. 즉, 인과 추론 을하려면 인과 모델이 필요합니다 .
ZXY
P(Y|do(X))=P(Y|X)XY
X
이것은 더욱 복잡해질 수 있습니다. 측정 오류 문제가있을 수 있으며 피험자가 다른 문제 중에서 연구를 중단하거나 지시를 따르지 않을 수 있습니다. 그러한 것들이 추론으로 진행되는 방법과 관련하여 가정해야합니다. "순전히"관측 데이터를 사용하면 더 문제가 될 수 있습니다. 일반적으로 연구원들은 데이터 생성 프로세스에 대해 잘 모르기 때문입니다.
따라서 모델에서 인과 적 추론을 도출하려면 통계적 가정뿐만 아니라 가장 중요한 인과 적 가정을 판단해야합니다. 인과 분석에 대한 일반적인 위협은 다음과 같습니다.
- 불완전하고 부정확 한 데이터
- 대상 인과 관심 양이 잘 정의되지 않았습니다 (확인하려는 인과 효과는 무엇입니까? 대상 모집단은 무엇입니까?)
- 혼란 스러움
- 선택 바이어스 (자체 선택, 절단 된 샘플)
- 측정 오류 (소음뿐만 아니라 혼란을 유발할 수 있음)
- 잘못된 사양 (예 : 잘못된 기능적 형태)
- 외부 유효성 문제 (타겟 모집단에 대한 잘못된 유추)
때때로 이러한 문제가 없다는 주장 (또는 이러한 문제를 해결 한 주장)은 연구 자체의 설계에 의해 뒷받침 될 수 있습니다. 실험 데이터가 일반적으로 더 신뢰할 수있는 이유입니다. 그러나 때때로 사람들은 이론이나 편의를 위해 이러한 문제를 제거합니다. 이론이 사회 과학 에서처럼 부드러 우면 결론을 액면가로 취하기가 더 어려울 것이다.
백업 할 수없는 가정이 있다고 생각 될 때, 그 가정이 그러한 가정에 대한 그럴듯한 위반에 얼마나 민감한 지 평가해야합니다.이를 보통 민감도 분석이라고합니다.