SPSS의 데이터 집합에 대해 단계별 로지스틱 회귀 분석을 적용하고 있습니다. 이 절차에서는 모델을 대략 임의의 하위 집합에 맞 춥니 다. 전체 표본의 60 %, 약 330 건입니다.
내가 흥미로운 점은 데이터를 다시 샘플링 할 때마다 최종 모델에서 다른 변수가 나타나고 나오는 것입니다. 최종 모형에는 항상 소수의 예측 변수가 있지만 표본에 따라 다른 예측 변수가 들어오고 나옵니다.
내 질문은 이것입니다. 이것을 처리하는 가장 좋은 방법은 무엇입니까? 예측 변수의 수렴을 기대하고 있었지만 실제로는 그렇지 않습니다. 일부 모델은 운영 관점에서 훨씬 직관적으로 이해되고 (의사 결정자에게 설명하기 더 쉬울 수 있음), 다른 모델은 데이터에 약간 더 적합합니다.
간단히 말해서, 변수가 뒤섞여 있기 때문에 내 상황을 어떻게 다루는 것이 좋습니까?
미리 감사드립니다.