샘플 상관 관계 의 제곱은 간단한 선형 회귀에 대한 R 2 결정 계수 와 동일 하다는 것이 종종 언급된다 . 나는 이것을 스스로 증명할 수 없었으며이 사실에 대한 완전한 증거에 감사 할 것이다.
샘플 상관 관계 의 제곱은 간단한 선형 회귀에 대한 R 2 결정 계수 와 동일 하다는 것이 종종 언급된다 . 나는 이것을 스스로 증명할 수 없었으며이 사실에 대한 완전한 증거에 감사 할 것이다.
답변:
표기법에는 약간의 변형이있는 것 같습니다. 간단한 선형 회귀 분석에서는 일반적으로 관측 된 x 와 y 값 사이의 상관 관계에 대한 참조로 기호 이있는 "샘플 상관 계수"라는 문구를 보았습니다 . 이것이이 답변에 채택한 표기법입니다. 또한 관측 사이의 상관 관계를 참조하는 데 사용되는 동일한 구문 심볼 본 Y 끼워 맞춤 예를 ; 내 대답에서 나는 이것을 "다중 상관 계수"라고 지칭하고 심볼 R을 사용했다 . 이 답변은 왜 결정 계수가 r 의 제곱과 R 의 제곱 인지 모두 설명합니다.어떤 용도로 사용 되든 상관 없습니다.
상관 관계의 의미에 대한 몇 가지 간단한 사실 일단 결과는 대수학의 한 줄에 다음과 R이 포장 된 방정식까지 건너 뛸 것을 선호 할 수 있도록 설정됩니다. 공분산과 분산의 기본 속성을 증명할 필요가 없다고 생각합니다.
Var ( a X + b ) = a 2 Var ( X )
공분산이 대칭이고 임을 알면 후자는 전자에서 파생 될 수 있습니다 . 여기에서 우리는 상관 관계에 관한 또 다른 기본 사실을 도출합니다. 용 ≠ 0 , 그래서 긴 같이 X 및 Y는 영이 아닌 분산을 가지고
여기 는 IS 시그넘 또는 부호 함수 :이 값은 SGN ( ) = + 1 의 경우 > 0 및 SGN ( ) = - 1 경우 < 0 . 그것은 또한 사실 그 SGN ( ) = 0 의 경우 = 0 하지만,이 경우는 문제 우리를하지 않는 : X + B 것이다 상수, 그래서 바르 ( 분모를 우리는 상관을 계산할 수있다. 대칭 인수는 우리를 위해,이 결과를 일반화 할 수 , :
우리는 현재의 질문에 대답하기 위해 이보다 일반적인 공식이 필요하지 않지만 상황의 기하학을 강조하기 위해 그것을 포함합니다. 변수가 스케일되거나 변환 될 때 상관 관계가 변경되지 않는다고 말하지만 변수가 반영.
이것은 의 제곱합을 분해 한 것입니다 . 결정 계수에 대한 일반적인 공식은 이며,이 삼각형에서 는 실제로 의 제곱입니다 . 수식 대해 더 잘 알고있을 수 있습니다. 즉, 를 즉시 제공 하지만 이 더 일반적이며, 방금 바와 같이 줄어 듭니다. 1 − S S 잔차 1−sin2θ=cos2θRR2=SS 회귀 일정한 기간이 모델에 포함되어있는 경우 .