인과 모델링이이 질문에 답하는 열쇠라고 생각합니다. 처음 에는 데이터를보기 전에 올바른 조정 / 성형 / 제어 된 관심 효과를 식별하기 위해 직면 합니다. 성인의 키 / 폐 용량 관계를 추정하려면 흡연이 성장을 방해하고 폐 용량에 영향을 미치기 때문에 흡연 상태를 조정합니다. 혼동자는 관심있는 예측 변수와 인과 관계가 있고 관심있는 결과와 관련된 변수입니다. 유대 진주의 인과성, 2 판 참조. 데이터 수집 프로세스가 합리적인 탐색 논리와 이전 탐색 연구의 사전 지식을 사용하기 전에 올바른 혼란 변수에 대한 분석을 지정하고 강화해야합니다.
그러나 이것이 일부 연구자들이 조정 변수를 선택하기 위해 데이터 기반 방법에 의존하지 않는다는 것을 의미하지는 않습니다. 나는 확인 분석을 할 때 실제로 이것을하는 것에 동의하지 않습니다. 여러 조정 모델에 대한 모델 선택의 몇 가지 일반적인 기술은 최소한 그럴듯하다고 생각되는 모델 클래스로 제한 할 수있는 정방향 / 역방향 모델 선택입니다. 이에 대한 블랙 박스 AIC 선택 기준은 의 감소 가능성과 관련이 있습니다.R2이러한 조정 변수에 대한 선형 모형의 경우 역학에서 일반적인 또 다른 과정은 변수가 주 효과의 추정치 (확률 또는 위험 비율과 같은)를 10 % 이상 변경 한 경우에만 모형에 추가되는 것입니다. 이것이 AIC 기반 모델 선택보다 "정확한"것이지만, 여전히이 접근 방식에는 큰주의 사항이 있다고 생각합니다.
내 추천은 가설의 일부로 원하는 분석을 미리 지정하는 것입니다. 연령 조정 흡연 / 암 위험은 다른 매개 변수이며, 통제 된 연구에서 조악한 흡연 / 암 위험과는 다른 추론으로 이어집니다. 주제 지식을 사용하는 것은 회귀 분석에서 조정을위한 예측 변수를 선택하거나 실험 및 준 실험 설계의 다양한 다른 유형의 "제어 된"분석에서 계층화, 일치 또는 가중 변수로 예측자를 선택하는 가장 좋은 방법입니다.