나는 질문과 그 답을 언급하고 있습니다 : 로지스틱 회귀에서 개발 된 모델의 예측 능력을 비교하는 방법은 무엇입니까? @Clark Chong의 답변 및 @Frank Harrell의 답변 / 댓글. 그리고 Hosmer-Lemeshow 테스트에서 의 자유도 및 질문에 대한 질문 .
나는 DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow 논문, "물류 회귀 모형에 대한 적합도 검정의 비교", Statistics in Medicine, Vol. 16, 965-980 (1997) .
내가 읽은 질문은 "(확률) 예측 능력"을 명시 적으로 요구하기 때문에 혼란스러워했다. 이것은 필자 의 논문에서 위의 적합도 테스트의 목표 와 동일하지 않다고 생각한다 .
우리 대부분이 알고 있듯이, 로지스틱 회귀는 설명 변수와 성공 확률 사이의 S 자형 링크를 가정합니다. S 자형의 기능적 형태는 다음과 같습니다.
Hosmer-Lemeshow 검정의 단점이없는 것처럼, 우리는 (a) '(확률) 예측 능력 '과 (b) ' 적합성 '에 대한 검정을 구별해야한다고 생각합니다 .
전자의 목표는 확률이 잘 예측되는지 테스트하는 반면 적합도 검정은 위의 S 자 함수가 '올바른'함수인지 테스트합니다. 더 공식적으로 :
- '확률 예측 능력 테스트'에 대한 테스트 는 성공 확률이 모델에 의해 잘 예측되었음을 나타내는 가지며 ;
- 적합도 검정을 위해, 은 S- 형 기능성 형태가 올바른 (Hosmer et al. 참조). Hosmer et al. 링크 함수가 잘못되었거나 분모의 지수가 선형이 아닌 null에서 두 가지 유형의 편차를 탐지 할 수있는 힘을 찾는 시뮬레이션을 수행합니다.
분명히 위의 함수가 '올바른'기능적 형태를 갖는 경우 (따라서 테스트 에서 적합도 검정에 을 수락 할 수 있다고 결론을 내린다면 ) 예상 확률은 양호합니다 ...
첫 발언
그러나 귀무 가설을 기각하지 않으면 어떻게됩니까?에 설명 된대로 수용하는 것은 약한 결론입니다 . .
첫 번째 질문
내가 가진 가장 중요한 질문 / 발언은 적합도 이 기각되는 경우 테스트의 결론은 기능적 형태가 '올바른'것이 아니라는 것을 의미 하지만 확률은 다음과 같습니다. 잘 예측되지 않았습니까?
두번째 질문
또한 Hosmer 등의 결론을 지적하고 싶습니다. al; (나는 초록을 인용한다) :
''올바른 모형에 2 차 항이 있지만 선형 항만 포함 된 모형이 적합했을 때의 검정 성능을 조사한 결과 Pearson 카이 제곱, 비가 중 제곱합, Hosmer-Lemeshow decile 평활화 잔차 제곱합과 Stukel의 점수 테스트는 표본 크기가 100 일 때 선형성에서 중간 정도의 이탈을 감지하기 위해 검정력이 50 %를 초과하고 크기가 500 인 표본에 대해 동일한 대안에 대해 90 % 이상의 검정력을 갖습니다. 정확한 모형이 이분법과 연속 공변량 사이에 상호 작용이 있었지만 연속 공변량 모델 만 적합 할 때 모든 검정은 검정력이 없었습니다. 크기가 100 인 샘플의 경우 잘못 지정된 링크를 감지하는 능력이 떨어졌습니다. 점수 테스트는 최고의 성능을 보였지만 비대칭 링크 기능을 탐지하기 위해 50 %를 초과했습니다. 잘못 지정된 링크 함수를 감지하기위한 비가 중 제곱 테스트의 힘은 Stukel의 점수 테스트보다 약간 낮았습니다 ''
이 테스트에서 더 많은 검정력이 있거나 Hosmer-Lemeshow의 검정력이 낮다는 결론을 내릴 수 있습니까?
두번째 발언
Hosmer 등의 논문. 알. 위에서 언급했듯이 특정 이상을 탐지하기위한 검정력을 계산 (시뮬레이션)합니다 ( 이 지정된 경우에만 검정력을 계산할 수 있음 ). 이것은 내 생각에 이러한 결과가``모든 가능한 대안 '' 로 일반화 될 수 있음을 의미하지는 않습니다 .