«ensemble» 태그된 질문

머신 러닝에서 앙상블 방법은 여러 알고리즘을 결합하여 예측합니다. 배깅, 부스팅 및 스태킹이 몇 가지 예입니다.

4
랜덤 포레스트 방법론을 선형 회귀에 적용 할 수 있습니까?
랜덤 포레스트는 원래 훈련 데이터의 부트 스트랩 샘플 (입력 변수와 관측 값의 샘플)을 사용하여 각 트리가 생성되는 의사 결정 트리의 앙상블을 만들어 작동합니다. 선형 회귀 분석에 유사한 프로세스를 적용 할 수 있습니까? 각 k 회귀에 대해 랜덤 부트 스트랩 샘플을 사용하여 k 선형 회귀 모델 생성 모형과 같은 "무작위 회귀"를 …

1
임의 포리스트에서 LASSO 사용
다음 프로세스를 사용하여 임의의 포리스트를 만들고 싶습니다. 정보 획득을 사용하여 분할을 결정하는 임의의 데이터 및 기능 샘플에 트리를 구축 사전 정의 된 깊이를 초과하는 리프 노드를 종료하거나 분할하면 사전 정의 된 최소값보다 작은 리프 수가 생성됩니다. 각 트리에 클래스 레이블을 지정하는 대신 리프 노드에서 클래스 비율을 지정하십시오. 미리 정의 된 …


6
앙상블 방법을 구현하는 방법을 배우기위한 리소스
이론적으로는 (어떻게) 작동하는지 이해하지만 실제로 앙상블 방법을 사용하는 방법 (투표, 가중 혼합물 등)을 잘 모르겠습니다. 앙상블 메소드를 구현하기위한 좋은 리소스는 무엇입니까? 파이썬 구현과 관련된 특정 리소스가 있습니까? 편집하다: 의견에 대한 토론을 기반으로 일부를 정리하기 위해 randomForest 등과 같은 앙상블 알고리즘을 찾고 있지 않습니다. 대신 다른 알고리즘의 다른 분류를 어떻게 결합 …

2
모델을 만들기 위해 평균 회귀 계수에 이론적 인 문제가 있습니까?
각각 전체 데이터의 하위 집합을 기반으로 평균 여러 OLS 모델 인 회귀 모델을 만들고 싶습니다. 이것에 대한 아이디어는 이 논문을 기반으로 합니다 . k 개의 폴드를 생성하고 각각의 폴드없이 데이터에 k 개의 OLS 모델을 구축합니다. 그런 다음 회귀 계수를 평균하여 최종 모델을 얻습니다. 이것은 여러 개의 회귀 트리가 만들어지고 평균화되는 …

3
앙상블 시계열 모델
시계열 예측을 자동화해야하며 해당 계열의 기능 (계절, 추세, 노이즈 등)을 미리 알지 못합니다. 내 목표는 각 시리즈에 가장 적합한 모델을 얻는 것이 아니라 매우 나쁜 모델을 피하는 것입니다. 다시 말해, 매번 작은 오류를 얻는 것은 문제가되지 않지만 가끔 큰 오류를 얻는 것은 문제가됩니다. 다른 기법으로 계산 된 모델을 결합하여이를 달성 …

1
앙상블 학습 : 왜 모델 스태킹이 효과적입니까?
최근에는 앙상블 학습의 한 형태 인 모델 스태킹에 관심을 가지게되었습니다. 특히 회귀 문제에 대한 장난감 데이터 세트를 약간 실험했습니다. 나는 기본적으로 개별 "레벨 0"회귀자를 구현하고, 각 회귀 분석기의 출력 예측을 "메타 회귀 분석기"가 입력으로 사용할 수있는 새로운 기능으로 저장하고이 메타 회귀기를 이러한 새로운 기능 (수준에서의 예측)에 맞추 었습니다. 회귀 자 …

3
작은 n, 큰 p 문제에서 트리 기반 앙상블 방법으로 제한합니까?
랜덤 포레스트 (Random Forest)와 같은 트리 기반 앙상블 방법 및 후속 파생물 (예 : 조건부 포레스트)은 모두 상대적 변수의 중요성을 식별하기 위해 소위 "작은 n , 큰 p "문제에 유용 할 수 있습니다 . 실제로, 이것은 사실 인 것처럼 보이지만 내 질문은이 능력을 얼마나 멀리 가질 수 있습니까? 30 개의 …

1
관찰 된 이벤트와 예상 된 이벤트를 비교하는 방법은 무엇입니까?
4 가지 가능한 이벤트의 주파수 샘플이 하나 있다고 가정합니다. Event1 - 5 E2 - 1 E3 - 0 E4 - 12 내 이벤트의 예상 확률이 있습니다. p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 내 네 가지 사건의 관측 빈도의 합으로 (18) 사건의 예상 빈도를 올바르게 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.