상관 관계가있다 표준화 즉,의 공분산 공분산, 엑스 와 와이 의 표준 편차로 나눈 엑스 및 와이 . 설명해 드리겠습니다.
느슨하게 말하면 통계는 데이터를 모형에 적합시키고 모형이 해당 데이터 점을 얼마나 잘 설명하는지 평가하는 것으로 요약 할 수 있습니다 ( 결과 = 모형 + 오류 ). 이를 수행하는 한 가지 방법은 모델에서 편차의 합 또는 잔차 (res)를 계산하는 것입니다.
R E S = Σ ( X나는− x¯)
많은 통계적 계산이이를 기반으로합니다. 상관 계수 (아래 참조).
다음은 데이터 세트의 예입니다 R
(잔차는 빨간색 선으로 표시되고 그 값은 옆에 추가됨).
X <- c(8,9,10,13,15)
Y <- c(5,4,4,6,8)
각 데이터 포인트를 개별적으로보고 모델에서 값을 빼면 (예 : 평균;이 경우 X=11
및 Y=5.4
) 모델의 정확성을 평가할 수 있습니다. 모델이 실제 값을 과소 평가하거나 과소 평가했다고 말할 수 있습니다. 그러나 모형에서 모든 이탈을 합산 하면 총 오차가 0 인 경향 이 있으며 양수 값 (모델이 특정 데이터 포인트를 과소 평가 함)과 음수 값 (모델이 특정 데이터를 과대 평가 함)이 있으므로 값이 서로 상쇄됩니다. 포인트). 이 문제를 해결하기 위해 이탈의 합은 제곱되어 이제 합의 제곱 ( 에스에스 )이라고합니다.
에스에스= ∑ ( x나는− x¯) ( x나는− x¯) = ∑ ( x나는− x¯)2
n - 1에스2
에스2= S에스n - 1= ∑ ( x나는− x¯) ( x나는− x¯)n - 1= ∑ ( x나는− x¯)2n - 1
편의를 위해 표본 분산의 제곱근을 취할 수 있는데,이를 표본 표준 편차라고합니다.
s = s2−−√= S에스n - 1−−−√= ∑ ( x나는− x¯)2n - 1−−−−−−−√
공분산은 두 변수가 서로 관련되어 있는지 여부를 평가합니다. 양수 값은 한 변수가 평균에서 벗어날 때 다른 변수가 같은 방향으로 벗어날 수 있음을 나타냅니다.
c o vx , y= ∑ ( x나는− x¯) ( y나는− y¯)n - 1
아르 자형
r = c o vx , y에스엑스에스와이= ∑ ( x1− x¯) ( y나는− y¯)( n - 1 ) s엑스에스와이
r = 0.87X
Y
짧은 이야기, 예, 당신의 느낌은 옳지 만 내 대답이 어떤 맥락을 제공 할 수 있기를 바랍니다.