답변:
귀하의 질문에 대한 직접적인 통찰력은 없지만 일부 연구 논문 을 살펴 보았습니다. 물론, 당신이 희소 PCA , 주요 구성 요소 회귀 및 관련 주제에 대해 이야기하고 있음을 올바르게 이해하면 . 이 경우 논문은 다음과 같습니다.
또한 교차 검증 결과를 사용하여 LSI 공간에 대한 최적의 차원 수를 결정했습니다. 너무 적은 차원은 데이터의 예측력을 활용하지 않았습니다. 너무 많은 치수로 인해 과적 합이 발생했습니다. 그림 4는 LSI 치수 수가 다른 모델의 평균 오차 분포를 보여줍니다. 4 차원 LSI 공간을 가진 모델은 최소 평균 오류 수와 최소 중간 수 오류를 모두 생성하므로 최종 모델은 4 차원 LSI 공간을 사용하여 작성되었습니다.
ieee 회원이 아닌 경우 사본을 게시 할 수 있습니다.
이것은 내가 저학년에 쓴 논문에서 나온 것입니다. 로지스틱 회귀 모델에 사용할 차원 (잠재적 의미 체계 색인 작성은 PCA와 유사)을 결정해야하는 문제가있었습니다. 내가 한 것은 메트릭을 선택하고 (즉, 플래그 가능성 .5를 사용할 때의 오류율) 다른 차원에서 훈련 된 다른 모델에 대한이 오류율의 분포를 살펴 보았습니다. 그런 다음 오류율이 가장 낮은 모델을 선택했습니다. ROC 곡선 아래 영역과 같은 다른 메트릭을 사용할 수 있습니다.
단계적 회귀와 같은 것을 사용하여 차원의 수를 선택할 수도 있습니다. 구체적으로 어떤 유형의 회귀를 수행하고 있습니까?
sparse btw은 무슨 뜻인가요?