답변:
나는 두 가지를 모두 사용했으며 몇 가지 요점이 있습니다.
주목받는 컴퓨터 과학자에게 통계에 대해 쓰는 것은 스릴있었습니다. 당신의 진실입니다.
어떤 Errror 측정 값을 제공하든 부록에 완전한 결과 벡터를 제공하는 것이 좋습니다. 방법과 비교하고 싶지만 다른 오류 측정을 선호하는 사람들은 테이블에서 이러한 값을 얻을 수 있습니다.
:
체계적인 오류를 반영하지 않습니다. 원형 물체의 반지름 대신에 직경을 측정한다고 상상해보십시오. 과대 평가는 100 %로 예상되지만 여전히 1에 가까운 도달 할 수 있습니다 .
가 이해하기 어렵다는 이전 의견에 동의하지 않습니다 . 값이 클수록 모델이 더 정확하지만 시스템 오류가 포함될 수 있습니다.
제곱 잔차의 합의 비율을 만들고 평균으로 나눈 이해하기 쉬운 수식으로 표현할 수 있습니다.
:
높은 정밀도 (단일하지만 큰 특이 치가 과도하게 처벌 됨)와 체계적인 오류가없는 경우에만 낮은 도달 할 수 있습니다 . 따라서 낮은 R M S E 는 높은 R 2 보다 품질이 우수합니다 .
다른 사람들이 언급했듯이, 선택은 당신의 분야와 최첨단에 달려 있습니다. 비교할만한 방법이 있습니까? 동일한 측정 값을 사용하면 토론에서 분석법 이점을 쉽게 연결할 수 있습니다.
다음은 두 측정 항목의 차이점을 이해하기위한 매우 일반적인 안내서로 사용합니다.
RMSE는 당신에게 당신의 예측 값은 모델에 시도하는 실제 데이터에서 얼마나 가까운 (또는 파)의 감각을 준다. 이는 모델 예측의 정확성과 정밀도 (예 : 모델링 트리 높이)를 이해하려는 다양한 응용 분야에 유용합니다 .
찬성
단점
찬성
단점
물론 위의 내용은 샘플 크기와 샘플링 디자인에 따라 달라질 수 있으며 상관 관계가 원인을 암시하지 않는다는 일반적인 이해가 필요합니다.
실제로 통계 과학자는 모형의 최적 적합을 알아야하며, RMSE는 그의 강력한 연구에 참여하는 사람들에게 매우 중요합니다. RMSE가 거의 0에 가까우면 모형이 가장 적합합니다.
결정 계수는 농업 및 기타 분야와 같은 다른 과학자들에게 좋습니다. 0과 1 사이의 값입니다. 1이면 100 %의 값이 관찰 된 데이터 세트와 일치합니다. 0이면 데이터가 완전히 이기종입니다. Dr.SK. Khadar Babu, VIT University, Vellore, TamilNadu, 인도
벡터 중 하나의 각 요소에 숫자가 추가되면 RMSE가 변경됩니다. 벡터 중 하나 또는 둘 다의 모든 요소에 숫자를 곱한 경우에도 동일합니다. R 코드는 다음과 같습니다.
#RMSE vs pearson's correlation
one<-rnorm(100)
two<-one+rnorm(100)
rumis<-(two - one)^2
(RMSE<-sqrt(mean(rumis)))
cor(one,two)
oneA<-one+100
rumis<-(two - oneA)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneA,two)
oneB<-one*10
twoB<-two*10
rumis<-(twoB - oneB)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneB,twoB)
cor(oneB,twoB)^2
This value shows how well future outcomes can be predicted by the model
-이것은 매우 오해의 소지가 있으며 단지 잘못된 방향으로 기울어 져 있습니다 . 주어진 모델에서 높은 결정 계수가 미래의 결과가 얼마나 잘 예측되는지에 관한 보장은 없습니다.