R 제곱은 언제 음수입니까?


77

내 이해는 가 의 제곱이므로 음수가 될 수 없다는 것을 알고 있습니다. 그러나 SPSS에서 단일 독립 변수와 종속 변수를 사용하여 간단한 선형 회귀를 실행했습니다. 내 SPSS 출력은 대해 음수 값을 제공합니다 . R에서 직접 손으로 계산한다면 는 양수입니다. SPSS가 이것을 부정으로 계산하기 위해 무엇을 했습니까?R 2 R 2아르 자형2아르 자형2아르 자형2

R=-.395
R squared =-.156
B (un-standardized)=-1261.611

내가 사용한 코드 :

DATASET ACTIVATE DataSet1. 
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA 
           /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN 
           /DEPENDENT valueP /METHOD=ENTER ageP

음수 값을 얻습니다. 누구든지 이것이 무엇을 의미하는지 설명 할 수 있습니까?

부정적인 RSquared

여기에 이미지 설명을 입력하십시오


3
이것이 귀하의 질문에 대답합니까? stats.stackexchange.com/questions/6181/… 그렇지 않은 경우 자세한 정보를 제공하십시오. 이것은 어떤 절차의 "SPSS 출력"입니까?
whuber

2
선형 회귀 모형에 절편이 있습니까?
NPE

2
@Anne 다시, 어떤 SPSS 절차를 사용하고 있습니까?
whuber

1
@Anne 시계열 응답을 무시하는 것이 좋습니다. 데이터는 시계열이 아니며 시계열 프로 시저를 사용하지 않기 때문입니다. R 제곱이 음의 값으로 주어 졌습니까? 크기는 정확합니다 : . SPSS의 도움을 통해 음수 R에 대한 R- 제곱 값이 관례로 간주되는지 여부를 확인했지만 이것이 사실이라는 증거는 보이지 않습니다. 아마도 당신은 R- 제곱을 읽는 곳의 출력 스크린 샷을 게시 할 수 있습니까? (0.395)2=0.156
whuber

1
종속 변수는 주택 가격이므로 95 % CI가 120,000 일 가능성이 있습니다. 불행히도 데이터 사용 조건에 위배되므로 여기에 데이터를 게시 할 수 없습니다.
Anne

답변:


105

는 선택한 모형의 적합도를 수평선의 귀선 (제로 가설)과 비교합니다. 선택한 모형이 수평선보다 적합하지 않으면 R 2 가 음수입니다. 참고 R 2는 항상 무엇이든의 사각형이, 그래서 수학의 규칙을 위반하지 않고 음의 값을 가질 수 있습니다. R 2 는 선택한 모형이 데이터 추세를 따르지 않는 경우에만 음수이므로 수평선보다 더 적합합니다.아르 자형2아르 자형2아르 자형2아르 자형2

예 : 절편이 1500이 되도록 제한된 선형 회귀 모형에 데이터를 적합 시킵니다.와이1500

여기에 이미지 설명을 입력하십시오

이러한 데이터가 주어지면 모델은 전혀 의미가 없습니다. 아마도 실수로 선택한 잘못된 모델 일 것입니다.

(에스에스reg)(에스에스더하다)아르 자형21에스에스reg에스에스더하다에스에스reg에스에스더하다아르 자형2

아르 자형2아르 자형아르 자형2아르 자형2

아르 자형2


3
@JMS 내 인터넷 검색에서 나타내는 것과 반대입니다. "/ ORIGIN"은 가로 채기를 0으로 수정합니다. "/ NOORIGIN"은 "SPSS에 상수를 억제하지 않도록 지시합니다"( Windows 용 SPSS 소개 안내서 )
whuber

10
@ whuber 맞습니다. @ harvey-motulsky 음의 R ^ 2 값 규칙적인 OLS 회귀 (절편 포함)에 대한 수학적 불가능 (컴퓨터 버그를 암시)입니다. 이것이 바로 'REGRESSION'명령이하는 것과 원래 포스터가 요구하는 것입니다. 또한 OLS 회귀 분석의 경우 R ^ 2 예측 된 값과 관측 된 값 사이의 제곱 상관 관계입니다. 따라서 음수가 아니어야합니다. 하나의 예측 변수를 사용한 간단한 OLS 회귀 분석의 경우 예측 변수와 종속 변수 간의 제곱 된 상관 관계와 동일합니다. 다시 말하면 음수가 아니어야합니다.
Wolfgang

1
@whuber 실제로. 내 잘못이야; 분명히 나는 ​​SPSS를 사용하지 않거나 읽은 것으로 보인다 :)
JMS

1
@whuber. 선형 회귀를 사용하면 절편 (또는 아마도 경사)이 제한되어있을 때만 R2가 음수 일 수 있다고 지적하는 단락을 추가했습니다. 제약 조건이 없으면 R2는 양수 여야하고 상관 계수 r의 제곱과 같아야합니다.
Harvey Motulsky

1
@HarveyMotulsky,이 경우 절편 또는 기울기가 제한되지 않았습니다. Rsquared가 제한적일 경우에만 음수 일 수 있다고 말하는 것 같습니다. 이 특별한 경우에 무슨 일이 있었는지 자세히 설명해 주시겠습니까?
Anne

18

회귀에 절편을 포함하는 것을 잊었습니까? SPSS 코드에 익숙하지 않지만 Hayashi Econometrics의 21 페이지에 있습니다.

아르 자형2

아르 자형2=1나는=1이자형나는2나는=1(와이나는와이¯)2

아르 자형2

SPSS가 회귀에 절편을 포함하고 있는지 확인하고 확인합니다.


4
그녀의 코드에서 NOORIGIN 부속 명령은 절편이 모델에 포함되었다고 알려줍니다
ttnphns

2
이상 하네. 나는 NOORIGIN인터셉트가 모델에 포함되지 않고 단지 이름에서 벗어나는 것을 의미한다고 생각했을 것입니다.
매트 오브라이언

6

이것은 시계열이 Niid이고 (0,1,0) 형식의 부적절한 ARIMA 모델을 구성하는 경우 발생할 수 있습니다.이 모델은 드리프트가없는 첫 번째 차이 랜덤 워크 모델이며 분산 (제곱의 합-SSE)입니다. 잔차의 총계는 원래 계열의 분산 (제곱합 SSO)보다 큽니다. 따라서 방정식 1-SSE / SSO는 SSE가 SSO를 수행 할 때 음수를 산출합니다. 우리는 사용자가 단순히 가정 된 모델에 적합하거나 부적절한 절차를 사용하여 적절한 ARIMA 구조를 식별 / 형성 할 때이를 보았습니다. 더 큰 메시지는 모델이 시력을 왜곡시킬 수 있다는 것입니다. 귀하의 데이터에 액세스하지 않으면 귀하의 잘못된 결과를 설명하는 데 문제가 있습니다. IBM의 관심을 끌었습니까?

비생산적인 것으로 가정 된 모델에 대한 아이디어는 Harvey Motulsky에 의해 반영되었습니다. 그레이트 포스트 하비!


1
통계 감사. 아니요, 저는 IBM과 대화하지 않았습니다. 데이터는 시계열이 아닙니다. 특정 시점의 데이터입니다.
Anne

5
@Anne and others : 귀하의 데이터는 시계열이 아니며 시계열 절차를 사용하지 않으므로 제 답변을 무시하십시오. 시계열에 관여 할 때 음의 R 스퀘어를 관찰 한 다른 사람들은 내 게시물이 흥미롭고 접하게 유익한 것을 알 수 있습니다. 불행히도 다른 사람들은 그렇지 않을 수 있습니다.
IrishStat

@IrishStat : Harvey Motulsky 게시물에 대한 링크를 추가해 주시겠습니까?
kjetil b halvorsen

하비는 여기서 질문에 대답했습니다.
IrishStat
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.