상관 계수는 일반적으로 대문자 작성 되지만 때로는 그렇지 않습니다. 와 사이에 실제로 차이가 있는지 궁금합니다 . 은 상관 계수 이외의 다른 것을 의미 할 수 있습니까 ?r 2 R 2 r
상관 계수는 일반적으로 대문자 작성 되지만 때로는 그렇지 않습니다. 와 사이에 실제로 차이가 있는지 궁금합니다 . 은 상관 계수 이외의 다른 것을 의미 할 수 있습니까 ?r 2 R 2 r
답변:
이 문제에 대한 표기법은 약간 다릅니다.
은 다중 상관과 관련하여 사용되며 "다중 상관 계수"라고합니다. 관찰 된 응답 와 모델에 의해 적합 된 사이의 상관 관계 입니다. 일반적으로 몇 개의 예측 변수으로부터 예측 예 절편 및 기울기 계수 데이터로부터 추정 된 . 참고 .Y Y X 나 Y = β 0 + β 1 X 1 + β 2 X 2 β I 0 ≤ R ≤ 1
심볼 은 이변 량 경우에 사용되는 "샘플 상관 계수"입니다. 즉, 와 라는 두 변수가 있으며 일반적으로 샘플에서 와 사이의 상관 관계를 의미합니다 . 당신은 상관 관계의 추정으로이 문제를 처리 할 수 있습니다 넓은 인구의 두 변수 사이. 두 변수를 상관시키기 위해 어떤 변수가 예측 변수이고 어떤 변수가 반응인지 식별 할 필요는 없습니다. 실제로 와 사이의 상관 관계를 찾았다면 상관 관계는 대칭 이기 때문에 와 사이의 상관 관계와 같습니다.X Y X Y ρ Y X X Y. 참고 심볼 때 함께, 이러한 방법을 사용하는 (하나의 상승으로, 다른 하나는 내려가는 경향) 두 변수가 선형으로 감소 관계가있을 경우 (음의 상관 관계).r r < 0
표기법이 일치하지 않는 곳은 와 두 변수가 있고 간단한 선형 회귀 가 수행되는 경우입니다. 하나 개의 변수를 식별하는 수단이 반응 변수로, 상기 기타, 모델 예측기 변수 등을, 피팅 . 어떤 사람들은 또한 기호 을 사용하여 와 의 상관 관계를 나타내며 다른 사람들은 (다중 회귀와의 일관성을 위해) 씁니다.Y Y X Y = β 0 + β 1 X의 R Y Y R의 R X Y Y Y X Y의 R의 R R Y Y. 관찰 된 응답과 적합 된 응답 간의 상관 관계는 반드시 0보다 크거나 같아야합니다. 이것이 내가 심볼 을 사용하는 것을 좋아하지 않는 한 가지 이유 입니다.이 경우 와 의 상관 관계는 음수 일 수 있지만 와 사이의 상관 관계 는 양수입니다 (실제로는 단순히 와 사이의 상관 관계 )는 둘 다 기호 로 작성 될 수 있습니다 . 나는 일부 교과서와 Wikipedia 기사를 보았고 의 두 가지 의미를 거의 서로 바꾸어 놓고 불필요하게 혼란 스럽다는 것을 알았습니다. 나는 기호 선호한다단일 회귀 및 다중 회귀 분석에서 와 사이의 상관 관계
단순 및 다중 회귀 모두에서 모형에 절편 항이 들어있는 한 와 사이 의 은 단순히 결정 계수 의 제곱근입니다 (종종 "분산의 비율"이라고 함). "또는 유사). 구체적으로 간단한 선형 회귀의 경우, 여기서 와 사이의 상관 관계에 대해 을 작성 하고 는 회귀 결정 계수 또는 상관 제곱을 나타낼 수 있습니다 사이 와 . 이후Y Y R 2 X Y R 2 Y Y - 1 ≤ R ≤ 1 0 ≤ R ≤ 1 R = | r | X Y의 R = - 0.7 Y Y Y = β 0 + β 1 X에서 R = 0.7 R 2 = 및 , 이는. 당신이 사이의 상관 관계받을 경우에 따라서 예를 들어, 와 의 후 사이의 상관 관계 와 장착 회귀 선형 간단한에서 것 이고 결정 계수는 즉 반응의 변동의 거의 절반이 모델에 의해 설명됩니다.
모형에 절편이 포함되지 않은 경우 기호 가 모호합니다. 일반적으로 결정 계수로 사용되지만 일반적으로 평소 와 다른 방식 으로 계산 되므로 통계 소프트웨어에서 출력을 읽을 때주의하십시오. 그러면 더 이상 다중 상관 의 제곱 과 같지 않으며 이변 량의 경우 ! R r 2