'glm'을 사용하여 로지스틱 회귀 모델의 정확도를 찾는 한 가지 방법은 AUC 플롯을 찾는 것입니다. 연속 반응 변수 (패밀리 = '가우시안')로 발견 된 회귀 모델에 대해 동일한 내용을 확인하는 방법은 무엇입니까?
회귀 모형이 데이터를 얼마나 잘 적합시키는 지 확인하기 위해 어떤 방법을 사용합니까?
'glm'을 사용하여 로지스틱 회귀 모델의 정확도를 찾는 한 가지 방법은 AUC 플롯을 찾는 것입니다. 연속 반응 변수 (패밀리 = '가우시안')로 발견 된 회귀 모델에 대해 동일한 내용을 확인하는 방법은 무엇입니까?
회귀 모형이 데이터를 얼마나 잘 적합시키는 지 확인하기 위해 어떤 방법을 사용합니까?
답변:
" 선형 회귀 모델 진단 " 에 대한 간단한 검색을 시작 하는 것이 좋습니다 . 그러나 여기에 당신이 확인하도록 제안 할 것이 있습니다 :
가정이 만족스럽게 충족되는지 확인하십시오
산점도 또는 성분 + 잔차 그림을 사용하여 독립 예측 변수와 종속 변수 간의 선형 관계를 조사하십시오.
표준화 된 잔차 대 예측 된 값으로 도표를 작성하고 잔차가 매우 높은 극단 점이 없는지 확인하고 잔차의 산포가 예측 된 값을 따라 거의 유사 할뿐만 아니라 잔차 평균의 위와 아래로 크게 균등하게 퍼짐 제로.
y 축을 잔차 로 변경할 수도 있습니다 . 이 그림은 불일치 분산을 식별하는 데 도움이됩니다.
독립성을 가정하도록 연구 설계를 다시 검토하십시오.
가능한 공선 성을 검사하기 위해 VIF (variance inflation factor) 또는 공차 통계를 검색하십시오.
잠재적 영향 지점 검사
및 조정 된 통계 의 변화를 조사하십시오R 2
필요한 상호 작용 확인
모델을 다른 데이터 세트에 적용하고 성능을 확인하십시오.
plot.lm
Penguin_Knight에서 언급 한 대부분의 진단 플롯을 제공 할 수 있습니다.
를 사용 하여 모형이 훈련 데이터에 얼마나 적합한 지 조사 할 수 있습니다 . 모델에서 데이터의 분산 비율을 설명합니다.
실제 값과 비교할 때 테스트 세트에서 예측의 RMSE (근무 평균 제곱 오류)를 사용하는 것이 좋습니다. 연속 변수의 예측 오류를보고하는 표준 방법입니다.
나는 음모를 꾸미고에 의해 내 매개 변수 추정의 함수 형태를 확인하는 데 사용하고 비 파라 메트릭 (예를 들어, 커널 회귀) 또는 반 파라 메트릭 추정을하고 파라 메트릭 장착 곡선과 비교. 나는 이것이 첫 번째 단계에서 상호 작용 용어 또는 고차 용어를 포함하는 것보다 더 빠르거나 아마도 더 통찰력이 있다고 생각합니다.
R 패키지 np는 많은 비모수 적 및 반모 수적 기능을 제공하며 비 네트는 잘 작성되어 있습니다. http://cran.r-project.org/web/packages/np/vignettes/np.pdf
r-squared
태그와 태그를 보고 싶을 수도 있습니다goodness-of-fit
.