20 caret다양한 모델링 절차를 테스트하기 위해 R 의 라이브러리 를 사용하고 있습니다 . trainControl목적 하나는 리샘플링 방법을 지정할 수있다. 방법이 설명되어 문서의 섹션 2.3을 포함한다 : boot, boot632, cv, LOOCV, LGOCV, repeatedcv와 oob. 이들 중 일부는 추론하기 쉽지만 이러한 방법 중 일부가 명확하게 정의되어 있지는 않습니다. 이러한 리샘플링 방법에 해당하는 절차는 무엇입니까? r resampling caret — 람 알루 루아 소스 설명서 링크가 끊어졌습니다. 대신 이것을 사용하십시오 . — vikas
20 좋아, 여기 내 시도가있다 : 부팅-부트 스트랩 boot632-0.632 부트 스트랩 cv-교차 검증, 아마도 이것은 K- 폴드 교차 검증을 의미 합니다. LOOCV-jacknife라고도하는 일대일 교차 검증. LGOCV-계층 데이터에 대한 LOOCV의 변형 인 그룹 외부 교차 검증. repeatcv-아마도 무작위 서브 샘플링 유효성 검사가 반복 될 것입니다 . 즉, 데이터를 훈련시키고 테스트하기위한 분할은 무작위 방식으로 수행됩니다. oob – Breiman이 제안한 가방 밖 추정을 말하며 부트 스트랩 집계 와 관련이 있습니다. (링크의 파일은 ps 파일이 아니라 ps.Z 파일이므로 이름을 바꾼 다음 열어보십시오.) — mpiktas 소스 1 LGOCV는 훈련 세트와 유효성 검사 세트 사이에서 무작위로 n 번 반복된다고 생각합니다. 따라서 열차와 홀드 아웃 (트레인에서 모델 구축 및 홀드 아웃 확인)간에 데이터를 분할하는 일반적인 경우 대신이 프로세스가 여러 번 반복됩니다. — B_Miner 3 또한 repeatCV는 여러 번 수행 된 k- 폴드 교차 검증이라고 생각합니다. — B_Miner 믿기 어렵습니다. 어딘가에 문서화되어 있지 않습니다. — 앤드류
4 는 repeatedcv최대 쿤의 발표에 따르면, 확실히 10 배 교차 유효성 검사를 반복한다. 기본 리샘플링 체계는 부트 스트랩입니다. 리샘플링 방법에 대해 살펴볼 수있는 좋은 파일은 R 및 캐럿 패키지 ( pdf )를 사용한 예측 모델링입니다 . Max는 이것을 "useR! 2013"에서 발표했습니다. — tigergopro 소스