RMSE vs. 결정 계수


21

실제 모델을 평가 중이며 여기에서 사용해야하는 방법 중 하나를 알고 싶습니다 (RMSE와 계수 R2 사이).

문제는 다음과 같습니다. 입력 값 x, 대한 예측을 출력하는 함수가 yx¯=f(x)있습니다. 또한 라는 해당 값에 대한 실제 관찰이 있습니다.yx

내 질문은 RMSE 또는 의 장단점이 무엇인가 입니다. 나는 내가 연구하고있는 문제에 대한 논문에서 두 가지가 모두 사용되는 것을 보았다.R2

답변:


16

나는 두 가지를 모두 사용했으며 몇 가지 요점이 있습니다.

  • Rmse는 설명이 간단하기 때문에 유용합니다. 누구나 그것이 무엇인지 알고 있습니다.
  • Rmse는 상대 값을 표시하지 않습니다. 경우 , 구체적으로는 범위 알아야 α < Y X < β를 . 경우 α가 = 1 , β = 1,000 후 0.2 양호한 값이다. 경우 α = 0 , β = 1 , 그렇게 좋은 더이상 보이지 않는다.rmse=0.2α<yx<βα=1,β=1000α=0,β=1
  • 이전 접근 방식에 따라, rmse는 설문 조사한 사람 또는 측정 한 측정 값이 거의 균일하다는 사실을 숨길 수있는 좋은 방법입니다. 데이터가 무작위 인 경우, 목성 궤도를 도는 모델을 찾을 수 있습니다.
  • 일반적인 R 2 보다는 조정 된 측정 계수를 사용하십시오.R2
  • 결정 계수는 설명하기 어렵다. 현장 사용자도 \ footnote와 같은 각주 팁이 필요합니다. {조정 계수는 통계 모델로 설명 할 수있는 데이터 세트의 변동 비율입니다. 이 값은 모델이 미래의 결과를 얼마나 잘 예측할 수 있는지 보여줍니다. 는 최소 0, 최대 1을 사용할 수 있습니다.}R2
  • 그러나 결정 계수는 모델이 현상을 얼마나 잘 설명하는지 알려주는 데있어 매우 정확합니다. 만약 에 관계없이 Y (X) 의 값을, 모델은 나쁘다. 좋은 모델에 대한 컷오프 포인트는 0.6에서 시작한다고 생각합니다. 0.7-0.8 정도의 것이 있다면 모델이 매우 좋습니다.R2=0.2yx
  • 요약하자면, 은 모델을 사용하여 실제 데이터에서 진행되는 작업의 70 %를 설명 할 수 있다고 말합니다. 나머지 30 %는 당신이 모르고 설명 할 수없는 것입니다. 아마도 혼란스러운 요소가 있거나 모델을 구성 할 때 실수를했기 때문일 수 있습니다.R2=0.7
  • 컴퓨터 과학에서 거의 모든 사람이 rmse를 사용합니다. 사회 과학은 더 자주 사용합니다.R2
  • 모델의 매개 변수를 정당화 할 필요가 없으면 rmse를 사용하십시오. 그러나 모델을 작성하는 동안 매개 변수를 입력, 제거 또는 변경해야하는 경우 를 사용 하여 이러한 매개 변수가 데이터를 가장 잘 설명 할 수 있음을 표시해야합니다.R2
  • 를 사용 하려면 R 언어로 코딩하십시오. 라이브러리가 있으며 모든 결과를 얻을 수있는 데이터를 제공합니다.R2

주목받는 컴퓨터 과학자에게 통계에 대해 쓰는 것은 스릴있었습니다. 당신의 진실입니다.


8
This value shows how well future outcomes can be predicted by the model-이것은 매우 오해의 소지가 있으며 단지 잘못된 방향으로 기울어 져 있습니다 . 주어진 모델에서 높은 결정 계수가 미래의 결과가 얼마나 잘 예측되는지에 관한 보장은 없습니다.
Prophet60091

5
나는 "와 같은 문장 생각 하면 모델이 나쁘다R2=0.2 " ", 모델이 매우 좋다는R2=0.70.8 "총 일반화이다. 현실 세계 문제에 대한 아무는 경우 0.8 강하게 의심 overfitting 문제를 만들 것입니다 ...R2
usεr11852는 분석 재개 MONIC 말한다

3
경우 = 0.2에 관계없이 YX 값의 모델은 나쁘다. 좋은 모델의 컷오프 포인트는 0.6에서 시작한다고 생각합니다. 0.7-0.8 정도의 것이 있다면 모델이 매우 좋습니다. 이는 현재 작업중인 분야에 따라 크게 달라집니다. 내년에 스택 교환 관련 지수를 예측하려고한다고 상상해보십시오. 당신은 0.2 의 R 2 를 가진 세계에서 가장 부자 일 것 입니다. R2R2
Jan Hackenberg

Jan Hackenberg 및 Prophet60091에 동의합니다. 귀하의 답변 중 일부가 명확하게 잘못되어 있으며 이것이 왜 받아 들여지는 답변인지 사람들이 찬성하는 이유를 이해하지 못합니다. 실제로 이것은 사람들이 통계를 해석하는 방법을 모른 채 자신의 메트릭을 사용하고 있음을 의미합니다.
Cord Kaldemeyer

9

어떤 Errror 측정 값을 제공하든 부록에 완전한 결과 벡터를 제공하는 것이 좋습니다. 방법과 비교하고 싶지만 다른 오류 측정을 선호하는 사람들은 테이블에서 이러한 값을 얻을 수 있습니다.

:R2

  • 체계적인 오류를 반영하지 않습니다. 원형 물체의 반지름 대신에 직경을 측정한다고 상상해보십시오. 과대 평가는 100 %로 예상되지만 여전히 1에 가까운 도달 할 수 있습니다 .R2

  • 가 이해하기 어렵다는 이전 의견에 동의하지 않습니다 . 값이 클수록 모델이 더 정확하지만 시스템 오류가 포함될 수 있습니다.R2

  • 제곱 잔차의 합의 비율을 만들고 평균으로 나눈 이해하기 쉬운 수식으로 표현할 수 있습니다.

R2=1SSEmean=1(yiyi¯)2(yiy¯)2

  • 의 고급 버전으로 표현해야합니다 . . 더 많은 예측자가 모델을 처벌합니다. 과적 합에 대해 더 강력 할 것으로 예상됩니다.Radj.2

:RMSE

  • 높은 정밀도 (단일하지만 큰 특이 치가 과도하게 처벌 됨)와 체계적인 오류가없는 경우에만 낮은 도달 할 수 있습니다 . 따라서 낮은 R M S E 는 높은 R 2 보다 품질이 우수합니다 .RMSERMSER2

  • rel.RMSErel.RMSE

다른 사람들이 언급했듯이, 선택은 당신의 분야와 최첨단에 달려 있습니다. 비교할만한 방법이 있습니까? 동일한 측정 값을 사용하면 토론에서 분석법 이점을 쉽게 연결할 수 있습니다.


7

R2

다음은 두 측정 항목의 차이점을 이해하기위한 매우 일반적인 안내서로 사용합니다.

RMSE는 당신에게 당신의 예측 값은 모델에 시도하는 실제 데이터에서 얼마나 가까운 (또는 파)의 감각을 준다. 이는 모델 예측의 정확성과 정밀도 (예 : 모델링 트리 높이)를 이해하려는 다양한 응용 분야에 유용합니다 .

찬성

  1. 보고 된 값이 모델링되는 종속 변수와 동일한 단위로되어 있기 때문에 이해하고 전달하는 것이 상대적으로 쉽습니다.

단점

  1. 큰 오류에 민감합니다 (작은 예측 오류보다 큰 예측 오류에 불이익을줍니다).

R2

찬성

  1. 선택한 변수가 데이터에 얼마나 적합한 지 전체적으로 알 수 있습니다.

단점

  1. R2R2

물론 위의 내용은 샘플 크기와 샘플링 디자인에 따라 달라질 수 있으며 상관 관계가 원인을 암시하지 않는다는 일반적인 이해가 필요합니다.


1

MAE, 평균 절대 오차도 있습니다. RMSE와 달리 큰 오류에 지나치게 민감하지 않습니다. 내가 읽은 것에서 일부 필드는 RMSE를 선호하고 다른 필드는 MAE를 선호합니다. 둘 다 사용하고 싶습니다.


0

실제로 통계 과학자는 모형의 최적 적합을 알아야하며, RMSE는 그의 강력한 연구에 참여하는 사람들에게 매우 중요합니다. RMSE가 거의 0에 가까우면 모형이 가장 적합합니다.

결정 계수는 농업 및 기타 분야와 같은 다른 과학자들에게 좋습니다. 0과 1 사이의 값입니다. 1이면 100 %의 값이 관찰 된 데이터 세트와 일치합니다. 0이면 데이터가 완전히 이기종입니다. Dr.SK. Khadar Babu, VIT University, Vellore, TamilNadu, 인도


0

벡터 중 하나의 각 요소에 숫자가 추가되면 RMSE가 변경됩니다. 벡터 중 하나 또는 둘 다의 모든 요소에 숫자를 곱한 경우에도 동일합니다. R 코드는 다음과 같습니다.

#RMSE vs pearson's correlation
one<-rnorm(100)
two<-one+rnorm(100)

rumis<-(two - one)^2
(RMSE<-sqrt(mean(rumis)))
cor(one,two)

oneA<-one+100

rumis<-(two - oneA)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneA,two)

oneB<-one*10
twoB<-two*10

rumis<-(twoB - oneB)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneB,twoB)
cor(oneB,twoB)^2

0

RMSE 곱하기 관측치의 수는 분자 또는 R 제곱에 있고 후자의 분모는 모든 모델에서 일정하기 때문에 궁극적으로 차이점은 단지 표준화에 불과합니다. 다른 10 가지 모델).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.