을 제곱 하면 왜 분산이 설명됩니까?


13

이것은 기본적인 질문 일지 모르지만 회귀 모델 의 값을 단순히 제곱하여 설명 된 분산의 그림을 줄 수있는 이유가 궁금합니다 .R

나는 계수가 관계의 힘을 줄 수 있다는 것을 이해 하지만,이 값을 단순히 제곱하는 것이 설명 된 분산의 척도를 어떻게 제공하는지 이해하지 못합니다.R

이것에 대한 쉬운 설명이 있습니까?

도와 주셔서 감사합니다!


직관적이거나 더 수학적인 것을 찾고 있습니까? 이 사이트의 및 상관 계수에 대한 다른 질문을 살펴 보셨습니까 ? R2
추기경

1
두 관련된 질문은 여기여기에 예를 들어,. 거기 방정식을 가지고 놀면 수학적 동등성을 도출 할 수 있습니다. 그러나 직관의 관점에서 특히 도움이되지는 않습니다.
추기경

나는 이것을 반대 방향으로 본다. 1- 잔차 분산 / 총 분산으로 정의되는 것은 R 제곱이며, R은 그에 대한 포스트 제곱근입니다. 우리가 단순한 선형 회귀를 가질 때 R square는 상관 계수의 제곱으로 줄어 듭니다.
Michael R. Chernick

@Michael, 의심 할 여지없이 긍정적 인 것이 아니라 적절하게 서명 된 제곱근 을 말하려고했습니다 .
추기경

1
Rr

답변:


16

RYXθRcos(θ)YX||Y||cos(θ)XYX||Y||sin(θ)X

σY2=σY2cos2(θ)+σY2sin2(θ)
R2R

2
(+1) 실제로 너무 많은 핸드 파잉이 일어나지 않습니다. 기하학적 관점 내 생각에 가장 직관적입니다. 이런 방식으로 정확하게 사물을 묘사하는 고품질 오픈 소스 수치가있을 수 있습니다.
추기경

cor(y,y^)2R2

1
이것은 질문에 대한 답은 아니지만 R을 참조하지 않고 R 제곱을 상관 계수의 제곱으로 언급하는 방법을 보여줍니다. 따라서 내 주장을 확인하거나 반박하는 출처를 찾기가 어려울 수 있습니다. 이것은 위키피디아의 결정 계수에 관한 기사에서 발췌 한 것입니다.
Michael R. Chernick

제곱 상관 계수와 마찬가지로, 상수 + 선형 모델 (즉, 단순 선형 회귀)을 사용한 최소 제곱 회귀 후 R2는 관측 된 데이터 값과 모델링 된 (예측 된) 데이터 값 사이의 상관 계수의 제곱과 같습니다.
Michael R. Chernick

일반적인 조건에서 R2 값은 원래 데이터 값과 모델링 된 데이터 값 사이의 상관 계수의 제곱으로 계산되는 경우가 있습니다. 이 경우이 값은 모델링 된 값이 얼마나 좋은지 직접 측정하는 것이 아니라 모델링 된 값에서 예측 변수를 구성 할 수있는 정도를 측정하는 것입니다 (α + βƒi 형식의 수정 된 예측 변수 생성). Everitt (2002, p. 78)에 따르면,이 사용법은 구체적으로 "결정 계수"라는 용어의 정의입니다. 두 (일반) 변수 사이의 상관의 제곱입니다.
Michael R. Chernick
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.