내가 사용하고 rpart.control
위해 minsplit=2
, 그리고에서 다음과 같은 결과를 받았습니다 rpart()
기능을. 데이터가 과적 합되지 않도록하려면 분할 3 또는 분할 7을 사용해야합니까? 스플릿 7을 사용해야합니까? 알려주세요.
트리 구성에 실제로 사용되는 변수 :
[1] ct_a ct_b usr_a
Root node error: 23205/60 = 386.75
n= 60
CP nsplit rel error xerror xstd
1 0.615208 0 1.000000 1.05013 0.189409
2 0.181446 1 0.384792 0.54650 0.084423
3 0.044878 2 0.203346 0.31439 0.063681
4 0.027653 3 0.158468 0.27281 0.060605
5 0.025035 4 0.130815 0.30120 0.058992
6 0.022685 5 0.105780 0.29649 0.059138
7 0.013603 6 0.083095 0.21761 0.045295
8 0.010607 7 0.069492 0.21076 0.042196
9 0.010000 8 0.058885 0.21076 0.042196
1
이전 Q에 게시 한 후속 조치에서이 답변에 답변했습니다. 나중에 참조 하기 위해 후속 조치를 위해 Q를 편집해서는 안된다고 언급했습니다 !
—
개빈 심슨
앞으로 관련 질문을 검색하지 않으려면 다음은 이전 Q : stats.stackexchange.com/questions/13446/…에 대한 링크 입니다.
—
chl