상관 계수는 회귀 기울기 (베타)와 동일 할 것으로 예상했지만 두 개를 비교 한 것만 다릅니다. 그것들은 어떻게 다릅니 까? 다른 정보는 무엇입니까?
상관 계수는 회귀 기울기 (베타)와 동일 할 것으로 예상했지만 두 개를 비교 한 것만 다릅니다. 그것들은 어떻게 다릅니 까? 다른 정보는 무엇입니까?
답변:
Pearson의 상관 계수는 차원이 없으며 입력 변수의 차원과 스케일에 관계없이 -1과 1 사이에서 스케일됩니다.
예를 들어 질량을 그램 또는 킬로그램으로 입력하면 값과 아무런 차이가 없지만 그래디언트 / 기울기 (치수가 있고 그에 따라 크기가 조정 됨)와는 큰 차이가 있습니다. 대신 파운드 또는 톤 사용을 포함하여 스케일을 조정하면 아무런 차이가 없습니다 .
간단한 데모 (Python 사용에 대한 사과) :
import numpy as np
x = [10, 20, 30, 40]
y = [3, 5, 10, 11]
np.corrcoef(x,y)[0][1]
x = [1, 2, 3, 4]
np.corrcoef(x,y)[0][1]
기울기가 10 배 증가한 경우에도 임을 나타냅니다 .
이 -1과 1 사이에서 스케일링 되는 깔끔한 트릭이라고 고백해야합니다 (분자가 절대 값보다 절대 값을 절대로 가질 수없는 경우 중 하나입니다).
@Macro는 위에서 자세히 설명했듯이 기울기 이므로 Pearson의 이 기울기와 관련되어 있지만 올바르게 조정할 때만 올바른지 알 수 있습니다 표준 편차 (치수와 스케일을 효과적으로 복원합니다!)
처음에는 공식이 느슨하게 맞춰진 선 (낮은 )이 더 낮은 기울기를 초래 한다고 생각하는 것이 이상하다고 생각했습니다 . 그런 다음 예제를 작성하고 그라디언트를 지정하면 "느슨 함"을 변경하면 감소하지만 의 비례 증가로 상쇄됩니다 .
아래 차트에는 4 개의 데이터 세트가 표시되어 있습니다.
그 차이가 영향을 볼 수있는 반드시 영향을주지 않고 하고, 측정 단위, 따라서 규모에 영향을 미칠 수 영향을주지 않고