«cart» 태그된 질문

'분류와 회귀 나무'. CART는 널리 사용되는 머신 러닝 기술이며 랜덤 포레스트 및 그라디언트 부스팅 머신의 일반적인 구현과 같은 기술의 기초를 형성합니다.

2
출력이 여러 개인 랜덤 포레스트가 가능 / 실용적입니까?
랜덤 포레스트 (RF)는 경쟁적인 데이터 모델링 / 마이닝 방법입니다. RF 모델에는 출력 / 예측 변수라는 하나의 출력이 있습니다. RF를 사용하여 여러 출력을 모델링하는 순진한 접근 방식은 각 출력 변수에 대해 RF를 구성하는 것입니다. 따라서 우리는 N 개의 독립적 인 모델을 가지고 있으며, 출력 변수 사이에 상관 관계가있는 경우 중복 / …

2
CART에서 복잡성 매개 변수 선택
CART 모델을 작성하기위한 rpart () 루틴에서 트리를 제거하려는 복잡성 매개 변수를 지정합니다. 복잡성 매개 변수를 선택하기위한 두 가지 다른 권장 사항을 보았습니다. 가능한 최소 교차 검증 오류와 관련된 복잡성 매개 변수를 선택하십시오. 이 방법은 Quick-R 및 HSAUR에서 권장합니다 . 추정 된 교차 검증 된 오류가 여전히 가능한 최소 교차 검증 …
16 r  cart  rpart 


1
자식 노드의 Gini 감소 및 Gini 불순물
임의 포리스트에 대한 Gini 기능 중요도 측정 작업을하고 있습니다. 따라서 노드 불순물의 Gini 감소를 계산해야합니다. 여기 내가 그렇게하는 방법이 있는데, 그것은 정의와 충돌을 일으키고 어딘가에 잘못해야한다고 제안합니다 ... :) 이진 트리의 경우 왼쪽 및 오른쪽 자식의 확률을 고려하여 노드 의 Gini 불순물을 계산할 수 있습니다 nnn. i(n)=1−p2l−p2ri(n)=1−pl2−pr2 i(n) = 1 …

2
R에서 파티셔닝 트리 : 파티와 rpart
나무 분할을 살펴본 후 오랜 시간이 지났습니다. 지난번에 이런 일을했을 때, 나는 R의 파티 (핫혼이 만든)를 좋아합니다. 샘플링을 통한 조건부 추론에 대한 아이디어는 나에게 의미가 있습니다. 그러나 rpart도 호소했습니다. 현재 응용 프로그램에서 (세부 사항을 말할 수는 없지만 많은 피구금자 중 누가 감옥에 갈 것인지 결정하려고합니다) 임의의 숲, 가방, 부스팅 등의 …
15 r  cart  rpart  partitioning 

1
연속 변수를 예측할 때 의사 결정 트리 분할을 어떻게 구현해야합니까?
실제로 Random Forests의 구현을 작성하고 있지만 질문은 의사 결정 트리 (RF와 무관)에만 국한된다고 생각합니다. 따라서 컨텍스트는 의사 결정 트리에서 노드를 만들고 예측 변수와 대상 변수가 모두 연속적이라는 것입니다. 노드에는 데이터를 두 세트로 분할하기위한 분할 임계 값이 있으며 각 세트의 평균 목표 값을 기반으로 각 서브 세트에 대한 새로운 예측을 작성합니다. …


1
의사 결정 트리의 깊이
의사 결정 트리 알고리즘은 모든 단계에서 속성으로 분할되므로 의사 결정 트리의 최대 깊이는 데이터의 속성 수와 같습니다. 이 올바른지?

3
각 잎에 선형 회귀 모델이있는 회귀 트리 알고리즘
짧은 버전 : 의사 결정 트리를 작성할 수있는 R 패키지를 찾고 있지만 의사 결정 트리의 각 리프는 완전한 선형 회귀 모델입니다. AFAIK, 라이브러리 rpart는 종속 변수가 각 리프에서 일정한 의사 결정 트리를 만듭니다. rpart그러한 나무를 만들 수 있는 다른 라이브러리 (또는 내가 모르는 설정)가 있습니까? 긴 버전 : 훈련 데이터 …
14 r  regression  rpart  cart 


2
분류 및 회귀 트리 뒤의 수학
누구든지 CART 분류의 일부 수학을 설명 할 수 있습니까? 두 가지 주요 단계가 어떻게 진행되는지 이해하려고합니다. 예를 들어 데이터 세트에 대해 CART 분류기를 훈련시키고 예측 데이터를 표시하기 위해 테스트 데이터 세트를 사용했지만 다음과 같습니다. 나무의 초기 뿌리는 어떻게 선택됩니까? 각 가지가 왜 그리고 어떻게 형성됩니까? 15 개의 열과 23 개의 …

5
랜덤 포레스트 및 의사 결정 트리 알고리즘
임의의 포리스트는 배깅 개념을 따르는 의사 결정 트리 모음입니다. 한 의사 결정 트리에서 다음 의사 결정 트리로 이동할 때 마지막 의사 결정 트리에서 학습 한 정보는 다음 의사 결정으로 어떻게 넘어 갑니까? 내 이해에 따라 모든 의사 결정 트리에 대해 생성 된 다음 다음 의사 결정 트리가 잘못 분류 된 …

3
다단계 / 계층 구조 데이터의 임의 포리스트
나는 기계 학습, CART 기술 등을 처음 접했고, 순진한 것이 너무 명확하지 않기를 바랍니다. Random Forest는 다단계 / 계층 적 데이터 구조를 어떻게 처리합니까 (예 : 교차 수준 상호 작용이 필요한 경우)? 즉, 여러 계층 적 수준에서 분석 단위가 포함 된 데이터 세트 ( 예 : 학교 내에 중첩 된 …



당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.