현재 ~ 300 개의 변수와 800 개의 관측치가있는 데이터 세트에서 이진 결과에 대한 예측 모델을 작성 중입니다. 이 사이트에서 단계별 회귀와 관련된 문제와 사용하지 않는 이유에 대해 많이 읽었습니다.
저는 LASSO 회귀와 기능 선택 기능을 읽고 "캐럿"패키지 및 "glmnet"을 사용하여 구현에 성공했습니다.
나는 최적으로 모델의 계수를 추출 할 수 있어요 lambda
및 alpha
"캐럿"에서를; 그러나 계수를 해석하는 방법에 익숙하지 않습니다.
- LASSO 계수는 로지스틱 회귀와 같은 방법으로 해석됩니까?
- 로지스틱 회귀 분석에서 LASSO에서 선택한 기능을 사용하는 것이 적절합니까?
편집하다
다른 모든 계수를 일정하게 유지하면서 계수의 1 단위 변화에 대한 로그 확률로 LASSO 회귀로부터의 지수 계수에서와 같이 계수의 해석.