상관 계수는 회귀 기울기와 어떻게 다릅니 까?


69

상관 계수는 회귀 기울기 (베타)와 동일 할 것으로 예상했지만 두 개를 비교 한 것만 다릅니다. 그것들은 어떻게 다릅니 까? 다른 정보는 무엇입니까?


3
정규화되면 동일합니다. 그러나 유닛을 변경할 때 어떤 일이 발생하는지 생각해보십시오.
nicolas

나는 이 Q에 대한 최고 점수 답변 (그리고 아마도 내 A 는 상관 계수가 우리가 x와 x에서 y를 회귀하면 우리가 얻는 두 개의 기울기의 기하학적 평균의 절대 값으로 보일 수 있음을 보여줍니다) y는 각각 관련이 있습니다
statmerkur

답변:


82

Yi=α+βXi+εi
β^=cor(Yi,Xi)SD(Yi)SD(Xi)
SD(Yi)=SD(Xi)

XiYi

  • ±1

  • YiXiβ^YiXi


이 답변의 결과로, x에 대해 y를 회귀시키는 것이 y에 대해 y를 회귀시키는 역수는 아닙니다!
aginensky 2016 년


14

상관 계수는 조치 "기밀" 두 변수 사이의 선형 관계를 포함하고, -1과 1 사이의 경계이다. 0에 가까운 상관은 변수 간의 선형 연관을 나타내지 않지만, -1 또는 +1에 가까운 상관은 강한 선형 관계를 나타냅니다. 직관적으로 산점도를 통해 가장 적합한 선을 그리는 것이 더 쉬울수록 상관 관계가 더 커집니다.

+

따라서 상관 계수와 회귀 기울기는 반드시 같은 부호 (+ 또는-)를 가져야하지만 거의 같은 값을 가지지 않습니다.

간단하게하기 위해이 답은 간단한 선형 회귀를 가정합니다.


inf,inf

1

Pearson의 상관 계수는 차원이 없으며 입력 변수의 차원과 스케일에 관계없이 -1과 1 사이에서 스케일됩니다.

예를 들어 질량을 그램 또는 킬로그램으로 입력하면 값과 아무런 차이가 없지만 그래디언트 / 기울기 (치수가 있고 그에 따라 크기가 조정 됨)와는 큰 차이가 있습니다. 대신 파운드 또는 톤 사용을 포함하여 스케일을 조정하면 아무런 차이가 없습니다 .rr

간단한 데모 (Python 사용에 대한 사과) :

import numpy as np
x = [10, 20, 30, 40]
y = [3, 5, 10, 11]
np.corrcoef(x,y)[0][1]
x = [1, 2, 3, 4]
np.corrcoef(x,y)[0][1]

기울기가 10 배 증가한 경우에도 임을 나타냅니다 .r=0.969363

이 -1과 1 사이에서 스케일링 되는 깔끔한 트릭이라고 고백해야합니다 (분자가 절대 값보다 절대 값을 절대로 가질 수없는 경우 중 하나입니다).r

@Macro는 위에서 자세히 설명했듯이 기울기 이므로 Pearson의 이 기울기와 관련되어 있지만 올바르게 조정할 때만 올바른지 알 수 있습니다 표준 편차 (치수와 스케일을 효과적으로 복원합니다!)b=r(σyσx)r

처음에는 공식이 느슨하게 맞춰진 선 (낮은 )이 더 낮은 기울기를 초래 한다고 생각하는 것이 이상하다고 생각했습니다 . 그런 다음 예제를 작성하고 그라디언트를 지정하면 "느슨 함"을 변경하면 감소하지만 의 비례 증가로 상쇄됩니다 .rrσy

아래 차트에는 4 개의 데이터 세트가 표시되어 있습니다.x,y

  1. 의 결과 (그래디언트 , , , ) ...y=3xb=3r=1σx=2.89σy=8.66σyσx=3
  2. , , 인 난수로 동일하지만 계산할 수 있습니다.r=0.2447σx=2.89σy=34.69b=2.94
  3. y=15x (따라서 및 , , )b=15r=1σx=0.58σy=8.66
  4. (2)와 동일하지만 범위 가 감소 하므로 (및 , , ) xb=14.70r=0.2447σx=0.58σy=34.69상관 관계 및 기울기

그 차이가 영향을 볼 수있는 반드시 영향을주지 않고 하고, 측정 단위, 따라서 규모에 영향을 미칠 수 영향을주지 않고rbbr

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.