겹치지 않는 두 인구 (환자 및 건강, 총 ) 의 데이터 세트 에서 연속 종속 변수에 대한 중요한 예측 변수 ( 독립 변수 중) 를 찾고 싶습니다 . 예측 변수 사이의 상관 관계가 있습니다. 나는 예측 변수 중 어느 것이 종속 변수를 가능한 정확하게 예측하기보다는 "실제로"종속 변수와 관련이 있는지 알아내는 데 관심이 있습니다. 가능한 많은 접근 방식에 압도되어서 어떤 접근 방식이 가장 권장되는지 묻고 싶습니다.
내 이해에서 단계별 예측 또는 예측 변수 제외는 권장하지 않습니다.
예를 들어 모든 예측 변수에 대해 선형 회귀 분석을 실행하고 FDR을 사용하여 다중 비교를 위해 p- 값을 수정하십시오 (아마도 보수적입니까?)
주성분 회귀 분석 : 개별 예측 변수의 예측력에 대해서는 알 수 없지만 성분에 대해서만 해석 할 수 없으므로 해석하기가 어렵습니다.
다른 제안?