귀하의 질문은 일반적으로 예측 모델에 대한 다양한 유효성 검사를 다루는 것 같습니다. 교차 유효성 검사는 내부 유효성 또는 적어도 초기 모델링 단계와 더 관련이 있지만 더 많은 인구에 인과 관계를 그리는 것은 더 관련이 있습니다. 에 외부 타당성. 이것에 의해 (그리고 @Brett의 좋은 말에 따른 업데이트로서), 우리는 가상의 개념적 모델을 가정하여 (예를 들어 예측 자와 관심 결과 사이의 관계를 지정) 일반적으로 작업 샘플에 모델을 구축한다는 것을 의미합니다. 최소 분류 오류율 또는 최소 예측 오류로 신뢰할 수있는 추정치를 얻으려고합니다. 모델이 더 잘 수행 될수록 보이지 않는 데이터에 대한 결과를 더 잘 예측할 수 있기를 바랍니다. 그럼에도 불구하고 CV는 가정 된 인과 관계의 "유효성"이나 적절성에 대해서는 아무 것도 말하지 않습니다. 우리는 일부 중재 및 / 또는 중재 효과가 무시되거나 단순히 미리 알려지지 않은 모델로 확실히 괜찮은 결과를 얻을 수있었습니다.
내 요점은 모델을 검증하는 데 사용하는 방법이 무엇이든 (그리고 홀드 아웃 방법은 확실히 최선의 방법은 아니지만 단계적 모델 구축으로 인해 발생하는 문제를 완화하기 위해 역학 연구에서 널리 사용됨) 동일한 샘플로 작업한다는 것입니다 (우리는 더 많은 인구를 대표한다고 가정합니다). 반대로, 결과를 일반화하고 새로운 표본이나 그럴듯하게 관련된 집단에 대해 이러한 방식으로 추론 한 인과 관계는 일반적으로 복제 연구에 의해 수행됩니다 . 이를 통해 더 큰 범위의 개별 변형을 특징으로하고 다른 잠재적 인 관심 요소를 나타낼 수있는 "슈퍼 포퓰 레이션"에서 모델의 예측 능력을 안전하게 테스트 할 수 있습니다.
모델은 작업 샘플에 대한 유효한 예측을 제공 할 수 있으며 생각할 수있는 모든 잠재적 혼란자를 포함합니다. 그러나 초기 모델을 구축 할 때 식별되지 않은 인과 관계 경로에 다른 요인이 나타나기 때문에 새로운 데이터로는 잘 수행되지 않을 수 있습니다. 예를 들어, 일부 예측 변수와 그로 인한 인과 관계가 환자가 모집 된 특정 시험 센터에 의존하는 경우 발생할 수 있습니다.
유전자 역학에서, 우리는 DNA 마커와 관찰 된 표현형 사이의 인과 관계에 대한 지나치게 단순화 된 견해를 가지고 복잡한 질병을 모델링하려고 시도하기 때문에 많은 게놈 차원의 연관성 연구 를 복제하지 못합니다. 유전자 질환 (다발성), 유전자 환경 및 집단 하부 구조가 모두 작용하지만 , 예를 들어 게놈-전체 연관 신호의 검증, 증강 및 정제(Ioannidis et al., Nature Reviews Genetics, 2009 10). 따라서, 유전자 마커 세트 (매우 낮고 희박한 효과 크기를 갖는)와 관찰 된 표현형의 다변량 패턴 (예 : 백색 / 회색질의 부피 또는 fMRI를 통해 관찰 된 뇌의 국소 활동, 신경 심리학 적 평가 또는 성격 목록에 대한 반응)에도 불구하고 여전히 독립적 인 샘플에서 예상대로 수행되지 않습니다.
이 주제에 대한 일반적인 참고 자료 는 EW Steyerberg (Springer, 2009)의 17 장과 임상 예측 모델의 III 부를 추천 할 수 있습니다 . 나는 또한 Ioannidis의 다음 기사를 좋아합니다.
Ioannidis, JPA, 가장 많이 발표 된 연구 결과가 거짓 인 이유는 무엇입니까? PLoS Med. 2005 년 2 (8) : e124