«ensemble» 태그된 질문

머신 러닝에서 앙상블 방법은 여러 알고리즘을 결합하여 예측합니다. 배깅, 부스팅 및 스태킹이 몇 가지 예입니다.


2
그라디언트 부스팅 트리 및 임의의 포리스트
Friedman이 제안한 그라디언트 트리 부스팅은 의사 결정 트리를 기본 학습자로 사용합니다. 기본 의사 결정 트리를 가능한 한 복잡하게 (완전히 성장) 또는 단순하게 만들어야하는지 궁금합니다. 선택에 대한 설명이 있습니까? 랜덤 포레스트는 의사 결정 트리를 기본 학습자로 사용하는 또 다른 앙상블 방법입니다. 내 이해를 바탕으로, 우리는 일반적으로 각 반복마다 거의 완전히 자란 …

15
미국 선거 결과 2016 : 예측 모델에 어떤 문제가 있었습니까?
먼저 그것은 미국 선거인 Brexit 이었다 . 많은 모델 예측이 크게 한계에 이르렀으며 여기서 배울 교훈이 있습니까? 어제 오후 4시 (PST)까지 베팅 시장은 여전히 ​​힐러리 4 대 1을 선호했습니다. 나는 실제 돈을 가지고 베팅 시장이 모든 가능한 예측 모델의 앙상블 역할을해야한다고 생각합니다. 따라서 이러한 모델이 잘 작동하지 않았다고 말할 수는 …

2
선형 회귀에 대한 그라디언트 부스팅-왜 작동하지 않습니까?
그라디언트 부스팅에 대해 배우면서 메서드가 빌드 및 앙상블 모델을 만드는 데 사용하는 "약한 분류기"의 속성과 관련된 제약에 대해 들어 보지 못했습니다. 그러나 선형 회귀를 사용하는 GB의 응용 프로그램을 상상할 수 없었으며 실제로 테스트를 수행했을 때 작동하지 않습니다. 나는 제곱 잔차의 합의 기울기로 가장 표준적인 접근법을 테스트하고 후속 모델을 함께 추가했습니다. …

2
임의 포리스트의 상관 관계가 높은 변수가 정확도와 기능 선택을 왜곡하지 않습니까?
내 이해에서, 상관 관계가 높은 변수는 임의 포리스트 모델에서 다중 공선 성 문제를 일으키지 않습니다 (잘못되면 수정하십시오). 그러나 다른 방법으로, 비슷한 정보를 포함하는 변수가 너무 많으면 다른 모델이 아닌이 세트에서 모델 가중치가 너무 커 집니까? 예를 들어, 동일한 예측 검정력을 가진 두 세트의 정보 (A, B)가 있습니다. 변수 , , …

3
R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]
캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …

4
scikit-learn (또는 다른 파이썬 프레임 워크)을 사용하여 다른 종류의 회귀 변수 앙상블
회귀 작업을 해결하려고합니다. LassoLARS, SVR 및 Gradient Tree Boosting의 3 가지 모델이 서로 다른 데이터 하위 집합에 잘 작동한다는 것을 알았습니다. 나는이 3 가지 모델을 모두 사용하여 예측을 한 다음 '실제 출력'과 내 3 가지 모델의 출력 테이블을 만들 때마다 적어도 하나의 모델이 실제로 실제 출력에 가깝다는 것을 알았습니다. 비교적 …

2
약한 학습자의“강점”
앙상블 학습 (예 : 부스팅)에서 약한 학습자와 관련하여 몇 가지 밀접한 관련 질문이 있습니다. 이것은 바보처럼 들릴지 모르지만 강한 학습자와 반대로 약한 것을 사용하면 어떤 이점이 있습니까? (예 : "강력한"학습 방법으로 부스트하지 않는 이유는 무엇입니까?) 약한 학습자에게 어떤 종류의 "최적의"힘이 있습니까 (예 : 다른 모든 앙상블 파라미터를 고정 된 상태로 …

2
신경망 강화
최근에 나는 adaboost, gradient boost와 같은 boosting algorithm을 배우고 있었고 가장 많이 사용되는 약한 학습자가 나무라는 사실을 알고 있습니다. 신경망을 기본 학습자로 사용하기위한 최근의 성공적인 사례 (논문 또는 기사를 의미 함)가 있는지 알고 싶습니다.

3
캐럿이있는 스태킹 / 앙상블 모델
나는 종종 caretR을 사용하여 여러 가지 예측 모델을 훈련시키는 것을 자주 발견합니다. 나는를 사용 하여 동일한 교차 검증 폴드에서 모두 훈련 caret::: createFolds한 다음 교차 검증 오류를 기반으로 최고의 모델을 선택합니다. 그러나 여러 모델의 중앙값 예측은 종종 독립 테스트 세트에서 최상의 단일 모델을 능가합니다. 예를 들어 각 교차점에서 각 모델의 …
21 r  caret  ensemble 

3
기계 학습 모델 결합
나는 데이터 마이닝 / 기계 학습 등을 처음 사용합니다. 예측을 개선하기 위해 여러 모델과 동일한 모델의 런을 결합하는 몇 가지 방법에 대해 읽었습니다. 몇 가지 논문 (이론과 그리스 문자는 흥미롭고 훌륭하지만 코드와 실제 예제는 짧음)을 읽은 것에 대한 나의 인상은 다음과 같이 가야한다는 것입니다. 모델 ( knn, RF등)을 가져 와서 …

1
앙상블 학습의 k- 폴드 교차 검증
앙상블 학습의 k- 폴드 교차 검증을 위해 데이터를 분할하는 방법에 대해 혼란스러워합니다. 분류를위한 앙상블 학습 프레임 워크가 있다고 가정합니다. 첫 번째 계층에는 분류 모델 (예 : svm, 의사 결정 트리)이 있습니다. 두 번째 레이어에는 첫 번째 레이어의 예측을 결합하고 최종 예측을 제공하는 투표 모델이 포함되어 있습니다. 5 배 교차 검증을 …

3
앙상블 분류기를 언제 사용하지 않아야합니까?
일반적으로 샘플 외부 클래스 멤버십을 정확하게 예측하는 것이 목표 인 분류 문제에서 앙상블 분류기를 사용 하지 않아야 하는 시점은 언제 입니까? 이 질문은 항상 앙상블 학습을 사용하지 않는 이유 와 밀접한 관련이 있습니다. . 이 질문은 왜 앙상블을 항상 사용하지 않는지 묻습니다. 나는 앙상블이 아닌 것 보다 앙상블이 더 나쁜 …

5
앙상블 방법은 모든 구성 요소를 어떻게 능가합니까?
나는 앙상블 학습에 대해 약간 혼란스러워합니다. 간단히 말해서, k 모델을 실행하고 이러한 k 모델의 평균을 얻습니다. k 모델의 평균이 다른 모델보다 우수하다는 것을 어떻게 보장 할 수 있습니까? 편견이 "확산"또는 "평균화"되었음을 이해합니다. 그러나 앙상블에 두 개의 모델 (예 : k = 2)이 있고 그 중 하나가 다른 것보다 나쁘면 앙상블이 …

3
패턴 인식 작업에서 최첨단 앙상블 학습 알고리즘?
이 질문의 구조는 다음과 같습니다. 처음에는 앙상블 학습 의 개념을 제공하고 , 추가로 패턴 인식 작업 목록을 제공 한 다음 앙상블 학습 알고리즘의 예를 제공하고 마지막으로 내 질문을 소개합니다. 모든 추가 정보가 필요하지 않은 사람들은 헤드 라인을보고 바로 내 질문으로 넘어갈 수 있습니다. 앙상블 학습이란 무엇입니까? Wikipedia 기사 에 따르면 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.