«gbm» 태그된 질문

약한 예측 모델을 강력한 예측 모델로 결합하는 알고리즘 제품군입니다. 가장 일반적인 접근 방식은 그래디언트 부스팅이라고하며 가장 일반적으로 사용되는 약한 모델은 분류 / 회귀 트리입니다.

2
그라디언트 부스팅 트리 (GBM)와 Adaboost의 차이점에 대한 직관적 인 설명
GBM과 Adaboost의 차이점을 이해하려고합니다. 이것들은 내가 지금까지 이해 한 것입니다 : 부스팅 알고리즘은 모두 이전 모델의 오류를 파악하고 모델의 가중치 합계를 만듭니다. GBM과 Adaboost는 손실 기능을 제외하고는 매우 유사합니다. 그러나 여전히 그들 사이의 차이점에 대한 아이디어를 얻는 것이 어렵습니다. 누군가 나에게 직관적 인 설명을 해줄 수 있습니까?
48 boosting  gbm  adaboost 


5
GBM에서 상호 작용 깊이는 무엇을 의미합니까?
R에서 gbm의 상호 작용 깊이 매개 변수에 대한 질문이 있습니다. 이것은 멍청한 질문 일 수 있지만 사과 할 수는 있지만 트리의 터미널 노드 수를 나타내는 매개 변수는 기본적으로 X-way를 나타냅니다. 예측 자들 사이의 상호 작용? 그것이 어떻게 작동하는지 이해하려고 노력합니다. 또한 두 요인 변수가 단일 요인으로 결합 된 경우를 제외하고 …

1
R에서 GBM의 n.minobsinnode 매개 변수의 역할 [닫힘]
이 질문은 향후 방문자를 도울 것 같지 않습니다. 그것은 작은 지리적 영역, 특정 시점, 또는 인터넷의 전세계 관객에게 일반적으로 적용되지 않는 매우 좁은 상황에만 관련됩니다. 이 질문을보다 광범위하게 적용 할 수 있도록 도움말 센터를 방문하십시오 . 휴일 칠년 전에 . GBM 패키지에서 n.minobsinnode 매개 변수의 의미 를 알고 싶었습니다 . …
21 r  gbm 

3
XGBoost vs Python Sklearn 그라디언트 부스트 트리
XGBoost가 어떻게 작동하는지 이해하려고합니다. Python sklearn에서 그라디언트 향상 트리가 어떻게 작동하는지 이미 알고 있습니다. 분명하지 않은 것은 XGBoost가 동일한 방식으로 작동하지만 더 빠르거나 파이썬 구현과 근본적인 차이점이 있는지입니다. 이 논문을 읽을 때 http://learningsys.org/papers/LearningSys_2015_paper_32.pdf XGboost에서 나온 최종 결과가 Python 구현에서와 같은 것처럼 보이지만 주요 차이점은 XGboost가 각 회귀 트리에서 만들 수있는 …

2
GBM 분류에 불균형 한 수업 규모가 있습니까?
감독 이진 분류 문제를 처리하고 있습니다. GBM 패키지를 사용하여 개인을 감염되지 않은 / 감염된 것으로 분류하고 싶습니다. 감염된 사람보다 15 배나 더 감염되지 않았습니다. 클래스 크기가 불균형 한 경우 GBM 모델이 어려움을 겪고 있는지 궁금합니다. 이 질문에 대한 답변이 없습니다. 감염되지 않은 개인에게 1의 무게를, 감염된 사람에 15의 무게를 할당하여 …

4
반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.
caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

4
머신 러닝 알고리즘의 예측 구간
아래에 설명 된 프로세스가 유효하고 수용 가능하며 정당화가 가능한지 알고 싶습니다. 아이디어 :지도 학습 알고리즘은 데이터에 대한 기본 구조 / 분포를 가정하지 않습니다. 하루가 끝나면 포인트 견적을 출력합니다. 어떻게 든 추정치의 불확실성을 정량화하기를 희망합니다. 이제 ML 모델 구축 프로세스는 본질적으로 임의적입니다 (예 : 하이퍼 파라미터 튜닝을위한 교차 검증 및 확률 …

1
GBM 패키지와 GBM을 사용하는 Caret
을 사용하여 모델 튜닝을 수행 caret했지만 gbm패키지를 사용하여 모델을 다시 실행했습니다 . caret패키지가 사용 gbm하고 출력이 동일해야한다는 것을 이해합니다 . 그러나 data(iris)RMSE와 R ^ 2를 평가 지표로 사용하면 약 5 %의 모델에서 불일치가 발생합니다. 부분 종속성 플롯을 사용 하기 위해 최적의 모델 성능을 찾고 caret싶지만 다시 실행 하고 싶습니다 gbm. …

1
GBM 예측 간격을 찾는 방법
캐럿 패키지를 사용하여 GBM 모델로 작업하고 있으며 예측 데이터의 예측 간격을 해결하는 방법을 찾고 있습니다. 나는 광범위하게 검색했지만 Random Forest의 예측 간격을 찾기위한 몇 가지 아이디어 만 제시했습니다. 어떤 도움 / R 코드라도 대단히 감사하겠습니다!

4
일반화 된 부스트 회귀 모델에서 트리 수를 선택하는 방법은 무엇입니까?
GBM에서 트리 수를 선택하기위한 전략이 있습니까? 특히, ntrees의 인자 R의 gbm함수. 왜 당신이 ntrees가장 높은 합리적인 가치로 설정되어서는 안되는지 모르겠습니다 . 많은 수의 나무가 여러 GBM의 결과 변동성을 명확하게 감소시키는 것으로 나타났습니다. 나는 많은 나무가 과적 합으로 이어질 것이라고 생각하지 않습니다. 이견있는 사람?

1
부스트 회귀 트리 (BRT), 일반화 된 부스트 모델 (GBM) 및 그래디언트 부스팅 머신 (GBM) 조정
질문 : 부스트 회귀 트리 (BRT)와 일반화 된 부스트 모델 (GBM)의 차이점은 무엇입니까? 그것들을 서로 바꿔서 사용할 수 있습니까? 하나는 다른 형태입니까? Ridgeway에서 Friedman이 이전에 "Gradient Boosting Machine"(GBM)으로 제안한 내용을 설명하기 위해 "GBM (Generalized Boosted Regression Models)"이라는 문구를 사용한 이유는 무엇입니까? 이 두 약어는 동일하지만 동일한 내용을 설명하지만 다른 구에서 …

2
부스팅 트리에서 튜닝 매개 변수의 최적 값을 찾는 방법은 무엇입니까?
부스팅 트리 모델에는 3 개의 튜닝 매개 변수가 있다는 것을 알고 있습니다. 트리 수 (반복 횟수) 수축 매개 변수 분할 수 (각 구성 요소의 크기) 내 질문은 : 각 튜닝 매개 변수에 대해 최적의 값을 어떻게 찾아야합니까? 그리고 어떤 방법? 수축 매개 변수와 트리 수 매개 변수는 함께 작동합니다. 즉, …

3
distribution = "adaboost"와 함께 R gbm을 사용하는 방법은 무엇입니까?
설명서에 분포 = "adaboost"인 R gbm을 0-1 분류 문제에 사용할 수 있다고 나와 있습니다. 다음 코드 조각을 고려하십시오. gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000) gbm_predicted <- predict(gbm_algorithm, test_dataset, n.trees = 5000) 예측 문서에서 찾을 수 있습니다 .gbm 예측 벡터를 반환합니다. 기본적으로 예측은 …
9 r  gbm 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.