답변:
공분산은 한 변수의 변경이 두 번째 변수의 변경과 어떻게 관련되는지를 측정 한 것입니다. 특히 공분산은 두 변수가 선형으로 연관되는 정도를 측정합니다. 그러나 종종 단조 적으로 관련된 두 변수의 관계에 대한 일반적인 척도로 비공식적으로 사용되기도합니다. 공분산에 대한 유용한 직관적 설명이 많이 있습니다 .
공분산이 언급 한 각 용어와 어떻게 관련되는지에 관하여 :
(1) 상관 관계 의 값을 취 공분산의 스케일링 된 버전이다 의 상관 관계 완벽한 선형 조합을 지시하고 에는 선형 관계가 없음을 나타낸다. 이 스케일링은 원래 변수의 스케일 변화에 상관 관계를 변경하지 않습니다 (Akavall이 지적하고 +1의 예를 제공함). 스케일링 상수는 두 변수의 표준 편차의 곱입니다.
(2) 두 변수가 독립적 인 경우 공분산은 입니다. 그러나 공분산이 것은 변수가 독립적이라는 것을 의미하지 않습니다. 이 수치는 (Wikipedia에서)
(3) 분산 / 공분산 구조 (종종 단순히 호출 공분산 구조 반복 측정 설계에서)은 개인의 측정 가능성 (의존하므로 및) 상관 반복 사실을 모델링하기 위해 사용되는 구조를 의미한다 - 이는 모델링함으로써 이루어진다 반복 측정 의 공분산 행렬 의 항목 . 하나의 예는 각 반복 측정이 동일한 분산을 가지며 모든 측정 쌍이 동일하게 상관되도록 지정하는 일정 분산 을 갖는 교환 가능한 상관 구조입니다 . 더 나은 선택은 덜 상관되기 위해 시간에 더 멀리 떨어진 두 가지 측정이 필요한 공분산 구조를 지정하는 것입니다 (예 :자기 회귀 모델 ). 공분산 구조라는 용어 는 관측치가 상관 될 수 있는 많은 종류의 다변량 분석 에서 더 일반적으로 발생합니다 .
매크로의 대답은 훌륭하지만 공분산이 상관 관계와 어떤 관련이 있는지에 대해 더 덧붙이고 싶습니다. 공분산은 실제로 두 변수 간의 관계의 강도에 대해 말하지는 않지만 상관 관계는 그렇지 않습니다. 예를 들면 다음과 같습니다.
x = [1, 2, 3]
y = [4, 6, 10]
cov(x,y) = 2 #I am using population covariance here
이제 배율을 변경하고 x와 y에 10을 곱합니다
x = [10, 20, 30]
y = [40, 60, 100]
cov(x, y) = 200
척도를 변경하면 관계의 강도가 높아지지 않아야합니다. 따라서 공분산을 x와 y의 표준 편차 (상관 계수의 정의)로 나눠 조정할 수 있습니다.
위의 두 경우 모두 x와 y 사이의 상관 계수는 0.98198
입니다.