중요한 차이는 당신이 원하는 여부 :
- [가장 일반적인 경우] : 데이터와 동일한 인구에서 추출한 새로운 주제에 대한 예상 성능을 구성합니다.
- 표본에서 와 동일한 주제 에서 새로운 관측치에 대한 성과 추정치를 구성합니다 .
가장 일반적인 경우는 사례 번호 (1)입니다. 예를 들어, 응급실로 들어오는 사람의 심장 마비를 얼마나 잘 예측합니까? 그리고 만약 당신이 (1)의 경우에, 당신 은 거의 확실하게 (a) 기록적인 교차 검증보다는 주제별 교차 검증을해야합니다. (1)의 경우에 기록적인 검증을 수행하면 새로운 주제에 대한 불합리한 가짜 예상 성능으로 이어질 수 있습니다.
나는 당신이하려는 일을 정확하게 이해하지 못합니다 (아마도 자체 연구이므로 질문이 완전히 현실적이지는 않습니다). 나는 당신이 어떤 경우에 있는지 모른다. 당신이 훨씬 덜 일반적인 경우에 있다면 (2), 기록적인 현명한 확인은 괜찮을 수도 있습니다.
통계의 일반적인 주제는 독립적 인 것과 상관 된 것에 대해 신중하게 생각하는 것입니다. 일반적으로 독립적 인 관찰은 다른 주제 인 경향이 있습니다 . 새로운 과목의 성과를 예측 하려면 훈련을받지 않은 과목을 테스트해야합니다!
왜 레코드 단위가 아닌 주제별 교차 검증입니까?
일반적인 설정에서 동일한 개인의 반복 관찰은 기능을 조정 한 후에도 서로 상관됩니다. 따라서 기록적인 교차 검증을 통해 테스트 세트 는 트레이닝 세트와 무관합니다! 완벽한 상관 관계의 극단적 인 경우 훈련 세트와 테스트 세트에서 동일한 결과를 얻을 수 있습니다! 테스트 세트에 대한 교육을 받으십시오! 교차 검증에서 측정 된 성능은 새로운 주제에 대한 성능을 예측 하지 않습니다 .
예를 들어, 이 최근 논문 은 레코드 방식의 교차 검증을``Voodoo Machine Learning ''이라고합니다.
그럼에도 불구하고 몇 가지 주제로 할 일 ...
케이 = n
훈련을위한 데이터를 최대화하려면 교차 검증을 위해 한 가지 주제를 생략해야합니다. 각 반복은 다른 보류 주제에 대해 테스트하고 다른 모든 주제에 대해 학습합니다.
n = 38