«random-forest» 태그된 질문

랜덤 포레스트는 많은 의사 결정 트리의 출력을 결합하는 것을 기반으로하는 기계 학습 방법입니다.

9
임의의 숲에서 지식 얻기
임의의 숲은 블랙 박스로 간주되지만 최근에는 임의의 숲에서 어떤 지식을 얻을 수 있다고 생각하고 있었습니까? 가장 명백한 것은 변수의 중요성이며, 가장 간단한 변형에서는 변수의 발생 횟수를 계산하여 수행 할 수 있습니다. 두 번째로 생각한 것은 상호 작용입니다. 나무의 수가 충분히 크면 변수 쌍의 발생 횟수를 테스트 할 수 있다고 생각합니다 …

2
그라디언트 부스팅 트리 및 임의의 포리스트
Friedman이 제안한 그라디언트 트리 부스팅은 의사 결정 트리를 기본 학습자로 사용합니다. 기본 의사 결정 트리를 가능한 한 복잡하게 (완전히 성장) 또는 단순하게 만들어야하는지 궁금합니다. 선택에 대한 설명이 있습니까? 랜덤 포레스트는 의사 결정 트리를 기본 학습자로 사용하는 또 다른 앙상블 방법입니다. 내 이해를 바탕으로, 우리는 일반적으로 각 반복마다 거의 완전히 자란 …

3
간행물에 임의의 포리스트를 표시하는 가장 좋은 방법은 무엇입니까?
1000 개의 기능을 갖춘 마이크로 어레이 연구에서 랜덤 포레스트 알고리즘을 두 그룹의 강력한 분류 자로 사용하고 있습니다. 논문에서 재현 할 수 있도록 충분한 정보가있을 수 있도록 임의의 숲을 제시하는 가장 좋은 방법은 무엇입니까? 피처 수가 적을 경우 실제로 트리를 그리는 플롯 방법이 있습니까? 오류율의 OOB 추정치는 인용하기 가장 좋은 통계입니까?

2
랜덤 포레스트 튜닝에 대한 실질적인 질문
내 질문은 랜덤 포레스트에 관한 것입니다. 이 아름다운 분류기의 개념은 나에게 분명하지만 여전히 실제적인 사용법 질문이 많이 있습니다. 불행히도, 나는 RF에 대한 실용적인 가이드를 찾지 못했습니다 (Geoffrey Hinton의 "제한된 Boltzman 기계 훈련을위한 실용 가이드"와 같은 것을 찾고 있었지만 임의의 숲)! 실제로 RF를 어떻게 튜닝 할 수 있습니까? 더 많은 수의 …

3
randomForest :: getTree ()에서 실제로 샘플 트리를 그리는 방법은 무엇입니까? [닫은]
누구나 실제로 몇 가지 샘플 트리 를 플롯하는 방법에 대한 라이브러리 또는 코드 제안이 있습니다. getTree(rfobj, k, labelVar=TRUE) (예를 들어, 당신 이이 작업을 수행하지 않아야한다는 것을 알고 있습니다. RF는 블랙 박스 등입니다.) 시각적으로 나무가 온전한 지 확인하여 변수가 반 직관적으로 작동하는지 확인하고, 조정 / 조합 / 분산 / 변환, 확인이 …

6
랜덤 포레스트 모델의 예측에는 예측 간격이 있습니까?
randomForest모델을 실행하면 모델을 기반으로 예측할 수 있습니다. 모델의 답이 얼마나 "확실"한지 알 수 있도록 각 예측의 예측 간격을 얻는 방법이 있습니까? 이것이 가능하다면 전체 모델에 대한 종속 변수의 변동성에 기초한 것일까 요? 아니면 특정 예측에 따른 특정 의사 결정 트리에 따라 더 넓고 좁은 간격을 가질 것입니까?

5
랜덤 포레스트는 부스팅 알고리즘입니까?
부스팅의 짧은 정의 : 약한 학습자 세트가 하나의 강력한 학습자를 만들 수 있습니까? 약한 학습자는 실제 분류와 약간만 관련이있는 분류 자로 정의됩니다 (임의 추측보다 예제를 더 잘 레이블링 할 수 있음). 랜덤 포레스트 의 짧은 정의 : 랜덤 포레스트는 많은 분류 트리를 자랍니다. 입력 벡터에서 새 개체를 분류하려면 입력 벡터를 …


4
R의 임의 포리스트 계산 시간
10,000 개의 행과 34 개의 기능이있는 R 의 파티 패키지를 사용하고 있으며 일부 요인 기능에는 300 개 이상의 레벨이 있습니다. 컴퓨팅 시간이 너무 깁니다. (지금까지 3 시간이 걸렸으며 아직 끝나지 않았습니다.) 임의 포리스트의 컴퓨팅 시간에 어떤 요소가 큰 영향을 미치는지 알고 싶습니다. 레벨이 너무 많은 요인이 있습니까? RF 컴퓨팅 시간을 …
48 r  random-forest 


5
랜덤 포레스트 알고리즘의 최적화 된 구현
ALGLIB, Waffles 및와 같은 R 패키지와 같은 임의의 포리스트가 구현되어 있음을 알았습니다 randomForest. 이 라이브러리가 고도로 최적화되어 있는지 아는 사람이 있습니까? 통계 학습의 요소에 자세히 설명 된대로 기본적으로 임의의 포리스트와 동등 합니까? 아니면 많은 추가 트릭이 추가 되었습니까? 이 질문이 충분히 구체적이기를 바랍니다. 내가 찾고있는 답변 유형의 삽화로 누군가 선형 …

2
임의의 숲 가정
나는 임의의 숲에 익숙하지 않아서 여전히 몇 가지 기본 개념으로 어려움을 겪고 있습니다. 선형 회귀 분석에서 우리는 독립적 인 관찰, 일정한 분산을 가정합니다… 랜덤 포레스트를 사용할 때 우리가 만드는 기본 가정 / 가설은 무엇입니까? 모델 가정 측면에서 임의의 포리스트와 순진 베이 사이의 주요 차이점은 무엇입니까?


6
랜덤 포레스트-오버 피팅 처리 방법
컴퓨터 과학 배경을 가지고 있지만 인터넷에서 문제를 해결하여 데이터 과학을 가르치려고합니다. 나는 지난 몇 주 동안이 문제를 연구 해 왔습니다 (약 900 행과 10 기능). 처음에는 로지스틱 회귀를 사용했지만 이제는 임의의 포리스트로 전환했습니다. 훈련 데이터에서 임의의 포리스트 모델을 실행하면 auc (> 99 %)의 값이 실제로 높아집니다. 그러나 테스트 데이터에서 동일한 …

2
임의의 숲에서 변수의 중요도 측정
나는 회귀를 위해 임의의 숲을 가지고 놀았으며 두 가지 중요한 측정 수단의 의미와 해석 방법을 정확하게 파악하는 데 어려움을 겪고 있습니다. importance()함수는 각 변수에 대한 두 값을 제공한다 : %IncMSE및 IncNodePurity. 이 두 값에 대한 간단한 해석이 있습니까? 의 경우 IncNodePurity특히,이 단순히 양이 그 변수의 제거 다음 RSS 증가입니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.