랜덤 포레스트 부분 의존도 플롯에서 y 축의 의미


13

나는 RandomForestR 패키지를 사용하고 있으며 부분 의존도에서 Y 축의 값을 해석하는 방법에 혼란스러워합니다. 도움말 문서에 따르면 줄거리는 "클래스 확률에 대한 변수의 한계 효과에 대한 그래픽 묘사"입니다. 그러나 나는 y 축이 정확히 무엇을 나타내는 지 여전히 혼란 스럽습니다.

  • 특히 음수 값은 무엇을 의미합니까?
  • 클래스를 정확하게 예측하는 데 부정적인 영향을 미친다는 것은 무엇을 의미합니까?
  • 그리고이 수치에서 가장 중요한 특징은 무엇입니까? 그것은 최대 값, 추세의 모양 등입니까?
  • 부분 그림을 다른 변수의 부분 그림과 비교할 수 있습니까?
  • 이 그림을 Maxent (분산 모델링 소프트웨어)에서 생성 된 반응 곡선과 어떻게 비교할 수 있습니까?

부분 의존도의 일부 예

답변:


7

이 두 가지에 먼저 답하십시오.

특히 음수 값은 무엇을 의미합니까? 클래스를 정확하게 예측하는 데 부정적인 영향을 미친다는 것은 무엇을 의미합니까?

랜덤 포레스트 패키지 문서에서 부분 플롯이 계산 되는 방법의 정의를 보면, 플롯은 모형의 관점에서 클래스 확률에 대한 변수의 상대적 로짓 기여를 나타냅니다. 즉, 음수 값 (y 축)은 양수 클래스가 모형에 따라 독립 변수 (x 축)의 값에 대해 덜 가능성이 있음을 의미합니다. 마찬가지로 양수 값은 양수 클래스가 모델에 따라 독립 변수의 값에 대해 더 가능성이 높다는 것을 의미합니다. 분명히 0은 모델에 따른 클래스 확률에 평균 영향을 미치지 않음을 의미합니다.

그리고이 수치에서 가장 중요한 특징은 무엇입니까? 그것은 최대 값, 추세의 모양 등입니까?

기능 중요도를 결정하는 방법 에는 여러 가지 가 있으며 최대 절대 값은 간단한 측정 방법 중 하나입니다. 일반적으로 사람들은 부분 그림의 모양을보고 변수와 클래스 레이블 간의 관계에 대한 모델의 제안에 대한 이해를 수집합니다.

부분 그림을 다른 변수의 부분 그림과 비교할 수 있습니까?

이에 대한 대답은 덜 흑백입니다. 각 플롯의 y 축 범위를 확인할 수 있습니다. 변수의 전체 범위에 대해 하나의 변수에 대한 부분 의존도가 0에 가까우면 모델과 변수와 클래스 레이블의 관계가 없음을 나타냅니다. 귀하의 질문으로 돌아 가면, 범위가 클수록 전체적인 영향이 강 하므로이 점에서 비교 될 수 있습니다.

Maxent에 대한 경험이 없습니다.


모델이 2 클래스 분류에 대한 것이라고 가정하면 어떤 클래스가 긍정적 클래스인지, 어느 클래스가 부정적인지 결정하는 방법은 무엇입니까?
Kumar Vaibhav

좋은 질문입니다. 실험하고보아야합니다. 이 문서는 17 페이지y 의 요소에 따르면 분류 문제라고 가정합니다. 그러나 어떤 클래스가 긍정적 클래스 또는 부정적인 클래스에 매핑되는지는 밝히지 않습니다. 나는 1 또는 true가 양의 클래스에 매핑되고 0, -1 또는 false가 음의 클래스에 매핑되기를 희망하지만 R에서는 당연한 것으로 받아들이지 않을 것입니다.
Chris A.

which.class에서 인수 partialPlot및 요소의 첫 번째 수준에 기본값은 y. 따라서 첫 번째 수준이 y음수 인 경우에는 음수 인 경우를 partialPlot예측하게되는데 이는 예상하지 못한 것일 수 있습니다.
qoheleth
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.