와 사이에 차이점이 있습니까?


21

상관 계수는 일반적으로 대문자 작성 되지만 때로는 그렇지 않습니다. 와 사이에 실제로 차이가 있는지 궁금합니다 . 은 상관 계수 이외의 다른 것을 의미 할 수 있습니까 ?r 2 R 2 rRr2R2r


7
나는이 질문이 명백히 명확하게 규정되어 있고 용어가 일관되지 않은 방식으로 사용되는 문제를 다루고 있다는 것에 놀랐다. 더 나쁜 것은 대소 문자를 구분하기 때문에 설명을 찾기가 쉽지 않습니다! 이 두 개의 매우 다른 것들에 사용될 수 있다는 사실 외에도 , 결정 계수 가 의 제곱과 같지 않을 때 절편 항이없는 모형을 고려할 때 상황은 더욱 악화됩니다 . 사람들이 혼란스러운 표기법을 찾을 수 있다는 것은 놀라운 일이 아닙니다. R 2 RrR2R
Silverfish

답변:


18

이 문제에 대한 표기법은 약간 다릅니다.

R 은 다중 상관과 관련하여 사용되며 "다중 상관 계수"라고합니다. 관찰 된 응답 와 모델에 의해 적합 된 사이의 상관 관계 입니다. 일반적으로 몇 개의 예측 변수으로부터 예측 예 절편 및 기울기 계수 데이터로부터 추정 된 . 참고 .Y Y X Y = β 0 + β 1 X 1 + β 2 X 2 β I 0 R 1YY^Y^XiY^=β^0+β^1X1+β^2X2β^i0R1

심볼 은 이변 량 경우에 사용되는 "샘플 상관 계수"입니다. 즉, 와 라는 두 변수가 있으며 일반적으로 샘플에서 와 사이의 상관 관계를 의미합니다 . 당신은 상관 관계의 추정으로이 문제를 처리 할 수 있습니다 넓은 인구의 두 변수 사이. 두 변수를 상관시키기 위해 어떤 변수가 예측 변수이고 어떤 변수가 반응인지 식별 ​​할 필요는 없습니다. 실제로 와 사이의 상관 관계를 찾았다면 상관 관계는 대칭 이기 때문에 와 사이의 상관 관계와 같습니다.X Y X Y ρ Y X X YrXYXYρYXXY. 참고 심볼 때 함께, 이러한 방법을 사용하는 (하나의 상승으로, 다른 하나는 내려가는 경향) 두 변수가 선형으로 감소 관계가있을 경우 (음의 상관 관계).r r < 01r1rr<0

표기법이 일치하지 않는 곳은 와 두 변수가 있고 간단한 선형 회귀 가 수행되는 경우입니다. 하나 개의 변수를 식별하는 수단이 반응 변수로, 상기 기타, 모델 예측기 변수 등을, 피팅 . 어떤 사람들은 또한 기호 을 사용하여 와 의 상관 관계를 나타내며 다른 사람들은 (다중 회귀와의 일관성을 위해) 씁니다.Y Y X Y = β 0 + β 1 X의 R Y Y R의 R X Y Y Y X Y의 R의 R R Y YXYYXY^=β^0+β^1XrYY^R. 관찰 된 응답과 적합 된 응답 간의 상관 관계는 반드시 0보다 크거나 같아야합니다. 이것이 내가 심볼 을 사용하는 것을 좋아하지 않는 한 가지 이유 입니다.이 경우 와 의 상관 관계는 음수 일 수 있지만 와 사이의 상관 관계 는 양수입니다 (실제로는 단순히 와 사이의 상관 관계 )는 둘 다 기호 로 작성 될 수 있습니다 . 나는 일부 교과서와 Wikipedia 기사를 보았고 의 두 가지 의미를 거의 서로 바꾸어 놓고 불필요하게 혼란 스럽다는 것을 알았습니다. 나는 기호 선호한다rXYYY^XYrrR단일 회귀 및 다중 회귀 분석에서 와 사이의 상관 관계YY^

단순 및 다중 회귀 모두에서 모형에 절편 항이 들어있는 한 사이 은 단순히 결정 계수 의 제곱근입니다 (종종 "분산의 비율"이라고 함). "또는 유사). 구체적으로 간단한 선형 회귀의 경우, 여기서 와 사이의 상관 관계에 대해 을 작성 하고 는 회귀 결정 계수 또는 상관 제곱을 나타낼 수 있습니다 사이 와 . 이후Y Y R 2 RYY^R2R2=r2X Y R 2 Y Y - 1 R 1 0 R 1 R = | r | X Y의 R = - 0.7 Y Y Y = β 0 + β 1 X에서 R = 0.7 R 2 =rXYR2YY^1r1 및 , 이는. 당신이 사이의 상관 관계받을 경우에 따라서 예를 들어, 와 의 후 사이의 상관 관계 와 장착 회귀 선형 간단한에서 것 이고 결정 계수는 즉 반응의 변동의 거의 절반이 모델에 의해 설명됩니다.0R1R=|r|XYr=0.7YY^Y=β^0+β^1XR=0.7R2=0.49

모형에 절편이 포함되지 않은 경우 기호 가 모호합니다. 일반적으로 결정 계수로 사용되지만 일반적으로 평소다른 방식 으로 계산 되므로 통계 소프트웨어에서 출력을 읽을 때주의하십시오. 그러면 더 이상 다중 상관 의 제곱 과 같지 않으며 이변 량의 경우 ! R r 2R2Rr2

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.