«caret» 태그된 질문

Caret은 예측 모델 생성 프로세스를 간소화하려는 함수 세트가 포함 된 R 패키지입니다.

3
R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]
캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …

3
R 캐럿 및 NA
나는 매개 변수 튜닝 기능과 균일 한 인터페이스에 대해 캐럿을 매우 선호하지만 적용된 "네이 키드"모델이 NA를 허용하더라도 항상 완전한 데이터 세트 (예 : NA가 없음)가 필요하다는 것을 관찰했습니다. 처음에는 필요하지 않은 힘든 대치 법을 적용해야한다는 점에서 매우 귀찮습니다. 어떻게 대치를 피하고 여전히 캐럿 이점을 사용할 수 있습니까?

2
캐럿에서 cv와 repeatcv의 실제 차이점은 무엇입니까?
이것은 질문 캐럿 리샘플링 방법 과 유사 하지만, 실제로이 부분에 대해서는 합의 된 방식으로 답변 한 적이 없습니다. 캐럿의 열차 기능 제공 cv및 repeatedcv. 말하는 것과의 차이점은 무엇입니까? MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) vs MyTrainControl=trainControl( method = "repeatedcv", number=5, repeats=5 ) cv세트를 k- 폴드 (parameter number) 로 나누고 …

5
과적 합 :은 총알이 없습니까?
올바른 교차 검증 및 모델 선택 절차를 따를 때에도 모델 복잡성, 기간에 제한을 두지 않는 한 모델을 충분히 검색 하지 않으면 과적 합 이 발생 한다는 것을 이해 합니다. 더욱이 사람들은 종종 그들이 제공 할 수있는 보호를 약화시키는 데이터로부터 모델 복잡성에 대한 처벌을 배우려고 시도합니다. 내 질문은 : 위의 진술에 …

3
캐럿이있는 스태킹 / 앙상블 모델
나는 종종 caretR을 사용하여 여러 가지 예측 모델을 훈련시키는 것을 자주 발견합니다. 나는를 사용 하여 동일한 교차 검증 폴드에서 모두 훈련 caret::: createFolds한 다음 교차 검증 오류를 기반으로 최고의 모델을 선택합니다. 그러나 여러 모델의 중앙값 예측은 종종 독립 테스트 세트에서 최상의 단일 모델을 능가합니다. 예를 들어 각 교차점에서 각 모델의 …
21 r  caret  ensemble 

2
캐럿 리샘플링 방법
caret다양한 모델링 절차를 테스트하기 위해 R 의 라이브러리 를 사용하고 있습니다 . trainControl목적 하나는 리샘플링 방법을 지정할 수있다. 방법이 설명되어 문서의 섹션 2.3을 포함한다 : boot, boot632, cv, LOOCV, LGOCV, repeatedcv와 oob. 이들 중 일부는 추론하기 쉽지만 이러한 방법 중 일부가 명확하게 정의되어 있지는 않습니다. 이러한 리샘플링 방법에 해당하는 절차는 …
20 r  resampling  caret 

2
캐럿 학습 기능은 알파 및 람다 모두에 대해 glmnet 교차 검증 기능을 수행합니까?
R caret패키지 가 모델 alpha과 모델 모두 에 lambda대해 교차 검증 glmnet됩니까? 이 코드를 실행하면 eGrid <- expand.grid(.alpha = (1:10) * 0.1, .lambda = (1:10) * 0.1) Control <- trainControl(method = "repeatedcv",repeats = 3,verboseIter =TRUE) netFit <- train(x =train_features, y = y_train, method = "glmnet", tuneGrid = eGrid, trControl = …

1
캐럿 및 계수 (glmnet)
특정 데이터 세트에 대한 추론을 위해 캐럿을 사용하는 데 관심이 있습니다. 다음을 수행 할 수 있습니까? 캐럿에서 훈련 한 glmnet 모델의 계수를 생성합니다. glm에 있다고 생각하지 않는 고유 한 기능 선택으로 인해 glmnet을 사용하고 싶습니다. ROC 측정 항목 외에 모델의 적합도를 평가하는 데 사용할 수있는 다른 측정 항목이 있습니까? 조정 …
19 caret  glmnet 

1
캐럿-반복 된 K- 폴드 교차 검증 대 중첩 된 K- 폴드 교차 검증, 반복 된 n 번
캐럿 패키지는 여러 기계 학습 모델을 구축하기위한 뛰어난 R 라이브러리이며, 모델 구축 및 평가에 대한 몇 가지 기능이 있습니다. 매개 변수 튜닝 및 모델 학습을 위해 caret 패키지는 방법 중 하나로 'repeatedcv'를 제공합니다. 모범 사례로서 다음과 같이 작동하는 중첩 된 K- 폴드 교차 검증을 사용하여 매개 변수 튜닝을 수행 할 …

2
R의 캐럿 패키지에서 PCA 및 k- 폴드 교차 검증
방금 Coursera의 기계 학습 과정에서 강의를 다시 보았습니다. 교수는지도 학습 응용 프로그램의 전처리 데이터에 대한 PCA에 대해 논의하는 섹션에서 PCA는 훈련 데이터에 대해서만 수행되어야하며 매핑은 교차 검증 및 테스트 세트를 변환하는 데 사용됩니다. PCA 및 열차 / 시험 분할 도 참조하십시오 . 그러나 caretR 패키지에서 train()함수에 전달한 학습 데이터 는 …

4
반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.
caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

3
CARET에서 매개 변수 튜닝 (그리드) 기능을 비활성화하는 방법이 있습니까?
CARET은 사전 지정된 튜닝 그리드를 사용하여 최종 모델을 선택하기 전에 다양한 모델을 구축 한 다음 전체 모델에 대한 최종 모델을 학습합니다. 매개 변수 조합을 하나만 사용하여 자체 조정 그리드를 제공 할 수 있습니다. 그러나이 경우에도 CARET은 튜닝 매개 변수 중에서이 모델에 가장 적합한 모델을 "선택"하고 (이 경우에는 하나만 있음) 최종 …
15 r  caret 

2
caret와 기본 randomForest 패키지를 통한 randomForest의 다른 결과
약간 혼란 스러워요 : 캐럿을 통한 훈련 된 모델의 결과는 원래 패키지의 모델과 어떻게 다를 수 있습니까? 캐럿 패키지와 함께 RandomForest의 FinalModel을 사용하여 예측 전에 사전 처리가 필요한지 여부를 읽습니다 .그러나 나는 여기서 전처리를 사용하지 않습니다. 캐럿 패키지를 사용하고 다른 mtry 값을 조정하여 다른 임의의 포리스트를 학습했습니다. > cvCtrl = …

1
캐럿 glmnet vs cv.glmnet
glmnetwithin caret을 사용하여 최적의 람다를 검색 cv.glmnet하고 동일한 작업을 수행하는 것을 비교하는 데 많은 혼란이있는 것 같습니다 . 다음과 같은 많은 질문이 제기되었습니다. 분류 모델 train.glmnet 대 cv.glmnet? 캐럿과 함께 glmnet을 사용하는 올바른 방법은 무엇입니까? `caret`를 사용한 교차 유효성 검사`glmnet` 그러나 질문의 ​​재현 가능성으로 인한 답변이 없습니다. 첫 번째 질문에 …

2
캐럿 패키지를 사용하면 특정 임계 값에 대한 혼동 행렬을 얻을 수 있습니까?
train이항 반응에 대한 로지스틱 회귀 모델 (via )을 얻었으며 confusionMatrixin에서 로지스틱 혼동 행렬을 얻었 습니다 caret. 물류 모델 혼동 행렬을 제공하지만 어떤 임계 값을 얻는 데 사용되는지 확실하지 않습니다. confusionMatrix에서를 사용하여 특정 임계 값에 대한 혼동 행렬을 얻으려면 어떻게해야 caret합니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.