MASS 패키지를 R
사용하여 MM 가중치 로 강력한 선형 모델을 추정했습니다 rlm()
. `R``은 모델에 값을 제공하지 않지만 의미있는 수량이라면 값을 원합니다. 또한 관측치가 강력한 회귀 분석에서 가중치를 적용한 것과 같은 방식으로 총 및 잔류 분산을 측정 하는 R 2 값을 갖는 데 어떤 의미가 있는지 알고 싶습니다 . 나의 일반적인 생각은, 회귀의 목적으로, 우리가 본질적으로 일부 추정치가 어떤 방식으로 이상치이기 때문에 약간의 영향을 덜주는 가중치를 가지고 있다면, 아마도 r 2 를 계산하기 위해 우리는 그것들을 제공해야한다는 것입니다 동일한 추정치가 덜 영향을 받습니까?
와 가중 R 2에 대해 두 가지 간단한 함수를 작성했습니다 . 아래에 있습니다. 또한 HI9라는 내 모델에 대해 이러한 기능을 실행 한 결과도 포함했습니다. 편집 : 나는 대한 수식을 제공 UNSW의 아델 코스터의 웹 페이지를 찾을 수 그 둘의 계산을 계산 가중치 벡터를 포함 하고 내가했던 것처럼, 그리고 더 공식적인 참조를 위해 그녀에게 물었다 : HTTP : //web.maths. unsw.edu.au/~adelle/Garvan/Assays/GoodnessOfFit.html (여전히 가중치 가중치 r 2 를 해석하는 방법에 대한 Cross Validated의 도움을 찾고 있습니다.)R2
SSe
SSt
#I used this function to calculate a basic r-squared from the robust linear model
r2 <- function(x){
+ SSe <- sum((x$resid)^2);
+ observed <- x$resid+x$fitted;
+ SSt <- sum((observed-mean(observed))^2);
+ value <- 1-SSe/SSt;
+ return(value);
+ }
r2(HI9)
[1] 0.2061147
#I used this function to calculate a weighted r-squared from the robust linear model
> r2ww <- function(x){
+ SSe <- sum((x$w*x$resid)^2); #the residual sum of squares is weighted
+ observed <- x$resid+x$fitted;
+ SSt <- sum((x$w*(observed-mean(observed)))^2); #the total sum of squares is weighted
+ value <- 1-SSe/SSt;
+ return(value);
+ }
> r2ww(HI9)
[1] 0.7716264
이에 답변하는 데 시간을 보낸 사람에게 감사합니다. 내가 놓친 것에 대해 이미 아주 좋은 참조가 있거나 위의 코드를 읽기 어려운 경우 사과드립니다 (코드 사람이 아닙니다).