로지스틱 회귀를 사용했습니다. 6 가지 기능이 있는데이 분류기의 다른 기능보다 결과에 더 많은 영향을 미치는 중요한 기능을 알고 싶습니다. Information Gain을 사용했지만 사용 된 분류 기준에 의존하지 않는 것 같습니다. 로지스틱 회귀와 같은 특정 분류 기준에 따라 중요도에 따라 기능의 순위를 매기는 방법이 있습니까? 도움을 주시면 감사하겠습니다.
로지스틱 회귀를 사용했습니다. 6 가지 기능이 있는데이 분류기의 다른 기능보다 결과에 더 많은 영향을 미치는 중요한 기능을 알고 싶습니다. Information Gain을 사용했지만 사용 된 분류 기준에 의존하지 않는 것 같습니다. 로지스틱 회귀와 같은 특정 분류 기준에 따라 중요도에 따라 기능의 순위를 매기는 방법이 있습니까? 도움을 주시면 감사하겠습니다.
답변:
나는 당신이 찾고있는 대답이 Boruta 알고리즘 일 것이라고 생각합니다 . 이것은 "모든 관련성"의미에서 기능의 중요성을 직접 측정하고 R 패키지로 구현되는 래퍼 방법으로, 기능 의 중요성이 y 축에 있고 y 축과 비교 되는 위치 와 같은 멋진 플롯을 생성 합니다. 여기에 파란색으로 표시되어 있습니다. 이 블로그 게시물 은 접근 방식을 설명하며 매우 명확한 소개로 읽을 것을 권장합니다.
회귀 모형의 중요도에 따라 변수 순위를 매기는 방법을 이해하기 시작하려면 선형 회귀부터 시작할 수 있습니다. 선형 회귀 모델에서 변수의 중요도를 평가하는 일반적인 방법은 를 각 변수에 기여한 기여도 로 분해하는 것 입니다. 그러나 변수의 상관 관계로 인해 선형 회귀 분석에서 변수의 중요성은 간단하지 않습니다. PMD 방법을 설명하는 문서를 참조하십시오 (Feldman, 2005) [ 3 ]. 또 다른 대중적인 접근 방식은 주문에 대한 평균화입니다 (LMG, 1980) [ 2 ].
로지스틱 회귀 모델에서 기능 중요도를 평가하는 일반적인 방법 목록은 다음과 같습니다.
참고 문헌 :
이게 도움이 되길 바란다. 추가 질문이 있는지 물어보십시오.