캐럿 리샘플링 방법


20

caret다양한 모델링 절차를 테스트하기 위해 R 의 라이브러리 를 사용하고 있습니다 .

trainControl목적 하나는 리샘플링 방법을 지정할 수있다. 방법이 설명되어 문서의 섹션 2.3을 포함한다 : boot, boot632, cv, LOOCV, LGOCV, repeatedcvoob. 이들 중 일부는 추론하기 쉽지만 이러한 방법 중 일부가 명확하게 정의되어 있지는 않습니다.

이러한 리샘플링 방법에 해당하는 절차는 무엇입니까?


설명서 링크가 끊어졌습니다. 대신 이것을 사용하십시오 .
vikas

답변:


20

좋아, 여기 내 시도가있다 :


1
LGOCV는 훈련 세트와 유효성 검사 세트 사이에서 무작위로 n 번 반복된다고 생각합니다. 따라서 열차와 홀드 아웃 (트레인에서 모델 구축 및 홀드 아웃 확인)간에 데이터를 분할하는 일반적인 경우 대신이 프로세스가 여러 번 반복됩니다.
B_Miner

3
또한 repeatCV는 여러 번 수행 된 k- 폴드 교차 검증이라고 생각합니다.
B_Miner

믿기 ​​어렵습니다. 어딘가에 문서화되어 있지 않습니다.
앤드류

4

repeatedcv최대 쿤의 발표에 따르면, 확실히 10 배 교차 유효성 검사를 반복한다. 기본 리샘플링 체계는 부트 스트랩입니다.

리샘플링 방법에 대해 살펴볼 수있는 좋은 파일은 R 및 캐럿 패키지 ( pdf )를 사용한 예측 모델링입니다 . Max는 이것을 "useR! 2013"에서 발표했습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.