답변:
경우 및 랜덤 변수이다 와 상수이고, 그 다음
중심 은 특별한 경우 및 이므로 중심 은 공분산에 영향을 미치지 않습니다.
또한 상관은
우리가 볼 수있는
특히 상관 관계는 중심에 영향을받지 않습니다.
그것은 이야기의 인구 버전이었습니다. 샘플 버전은 동일합니다.
사이의 공분산 추정치 및 페어링의 샘플 후,
"어딘가"는 다소 신뢰할 수없는 출처 인 경향이 있습니다 ...
공분산 / 상관은 명시 적 센터링으로 정의됩니다 . 데이터를 중심에 두지 않으면 공분산 / 상관을 계산하지 않은 것입니다. (정확하게 : Pearson 상관 관계)
주요 차이점은 이론적 모델 (예 : 예상 값이 정확히 0이어야 함)을 기반으로하는지 또는 데이터 (산술 평균)를 기반으로하는지 여부입니다. 산술 평균이 다른 중심보다 작은 공분산을 생성한다는 것을 쉽게 알 수 있습니다.
그러나 공분산이 작을수록 상관 관계가 작거나 반대되는 것은 아닙니다. 데이터 X = (1,2) 및 Y = (2,1)가 있다고 가정합니다. 산술 평균 중심화를 사용하면 완벽하게 음의 상관 관계를 얻을 수 있지만 생성 프로세스가 평균 0을 생성하면 데이터는 실제로 양의 상관 관계가 있음을 알 수 있습니다. 따라서이 예에서 우리는 중심에 있지만 이론적으로 예상되는 값은 0입니다.
이것은 쉽게 발생할 수 있습니다. 셀 번호가 -5에서 +5 인 센서 배열 11x11이 있다고 가정 해 봅시다. 산술 평균을 취하는 것보다는 센서 이벤트의 상관 관계를 찾을 때 여기에 센서 배열의 "물리적"평균을 사용하는 것이 합리적입니다 (셀 0 ~ 10을 열거하면 5를 고정 평균으로 사용합니다) 그리고 우리는 똑같은 결과를 얻을 것이므로 분석에서 색인 선택이 사라집니다.