나는 이것이 아마도 다른 곳에서 논의되었을 것이라는 것을 알고 있지만, 명확한 대답을 찾지 못했습니다. 선형 회귀 모델의 표본 외부 를 계산 하기 위해 공식 를 사용하려고합니다 . 여기서 은 잔차 제곱의 합이고 는 총 제곱합입니다. 훈련 세트의 경우,
테스트 세트는 어떻습니까? 샘플 에서 을 계속 사용해야합니까 , 아니면 사용해야 합니까?
를 사용하면 결과 가 때때로 음수 수 있음을 알았습니다 . 이것은 ( 샘플 테스트를 위해 linear_model의 함수 에서도 사용됨)를 사용하는 sklearn 함수 의 설명과 일치합니다 . 그들은 "입력 특징을 무시하고 항상 y의 기대 값을 예측하는 일정한 모델은 0.0의 R ^ 2 점수를 얻을 것"이라고 말한다.r2_score()
score()
그러나 다른 곳에서는 사람들이 여기 와 여기 에서 와 같이 했습니다 (dmi3kno의 두 번째 답변). 그래서 어느 것이 더 의미가 있는지 궁금했습니다. 모든 의견은 크게 감사하겠습니다!