잔차를 찾고 플로팅하는 방법


14

나는 데이터를 받았다

x = c(21,34,6,47,10,49,23,32,12,16,29,49,28,8,57,9,31,10,21,26,31,52,21,8,18,5,18,26,27,26,32,2,59,58,19,14,16,9,23,28,34,70,69,54,39,9,21,54,26)
y = c(47,76,33,78,62,78,33,64,83,67,61,85,46,53,55,71,59,41,82,56,39,89,31,43,29,55, 
     81,82,82,85,59,74,80,88,29,58,71,60,86,91,72,89,80,84,54,71,75,84,79)

잔차를 구하고 대 잔차를 어떻게 구할 수 있습니까? 잔차가 거의 정상으로 보이는지 어떻게 테스트 할 수 있습니까?x

방정식 얻었을 때 원래 선형 피팅을 올바르게 수행하는지 확실하지 않지만 강의 노트는 선형 회귀 선이 y i = β 0 + β 1 x + ϵ 형식이어야한다고 말합니다. .y=6.9x5.5yi=β0+β1x+ϵ


어떤 패키지를 사용하고 있습니까? 예를 들어 Matlab의 '회귀'함수는 잔차를 출력으로 반환하고 히스토그램을 사용하여 그래프를
그릴

Sagemath를 사용하고 있습니다. R을 사용할 수도 있지만 경험이 거의 없습니다.
손님

y=a+kxE[Y|X]=a+kXY=a+kX+ϵϵ

1
β0^=5.5β1^=6.9ri=yyy^i=yi(5.5+6.9xi)

답변:


28

편집 : 당신은 R태그가 있지만 코멘트에 당신이 그것에 대해 많이 모른다고 말합니다. 이것은 R코드입니다. 나는 세이지에 대해 아무것도 모른다. 편집 종료

당신은 이것을 할 수 있습니다

x = c(21,34,6,47,10,49,23,32,12,16,29,49,28,8,57,9,31,10,21,
      26,31,52,21,8,18,5,18,26,27,26,32,2,59,58,19,14,16,9,23,
      28,34,70,69,54,39,9,21,54,26)
y = c(47,76,33,78,62,78,33,64,83,67,61,85,46,53,55,71,59,41,82,
      56,39,89,31,43,29,55, 81,82,82,85,59,74,80,88,29,58,71,60,
      86,91,72,89,80,84,54,71,75,84,79)

m1 <- lm(y~x)  #Create a linear model
resid(m1) #List of residuals
plot(density(resid(m1))) #A density plot
qqnorm(resid(m1)) # A quantile normal plot - good for checking normality
qqline(resid(m1))

+1 @guest, 위 코드는 무료로 제공되는 R입니다.
BGreene

괜찮아. 그래서 캡션 밀도가있는 그림을 보았습니다 .default (x = resid (m1)). 이 코드는 두 개의 그래프를 출력해야합니까? 그래프에서 잔차가 거의 정상으로 보이는지 확인해야합니까?
손님

이 코드는 두 개의 그래프를 출력합니다. 하나는 밀도 플롯 (종 모양으로 보입니까?)이고 다른 하나는 Quantile 플롯입니다. 잔차가 완벽하게 정상이면 점이 모두 직선에 놓입니다.
Peter Flom-Monica Monica 복원

권리. 마지막 줄을 plot (qqnorm (resid (m1))) 및 plot (qqline (resid (m1)))으로 변경하면 코드가 작동합니다. 따라서 선보다 선 아래보다 더 먼 점이 있기 때문에 잔차가 정규 분포를 만족하지 않는다고 생각합니다. 정규성을 확인하기위한 수치 기준이 있습니까?
손님
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.