나는 두 개의 임의 변수의 공분산을 더 잘 이해하고 그것을 처음 생각한 사람이 통계에서 일상적으로 사용되는 정의에 어떻게 도달했는지 이해하려고 노력했습니다. 나는 그것을 더 잘 이해하기 위해 위키 백과 에 갔다 . 이 기사에서 대한 올바른 후보 측정 또는 수량 은 다음과 같은 속성을 가져야합니다.
- 두 개의 임의 변수가 유사 할 때 (즉, 하나가 다른 하나를 증가시킬 때와 다른 하나가 감소 할 때도) 양의 부호를 나타냅니다.
- 또한 두 개의 랜덤 변수가 반대로 비슷한 경우 (즉, 하나의 변수가 증가하면 다른 임의의 변수가 감소하는 경향이 있음) 음의 부호를 갖기를 원합니다
- 마지막으로, 두 변수가 서로 독립적 일 때 (즉, 서로에 대해 서로 상이하지 않을 때)이 공분산 양이 0 (또는 매우 작을까요?)이 되길 원합니다.
위의 속성에서 를 정의하려고합니다 . 첫 번째 질문은 가 왜 이러한 속성을 만족시키는 지 완전히 명확하지 않습니다 . 우리가 가진 속성에서 나는 더 많은 "유도 적"과 같은 방정식이 이상적인 후보가 될 것으로 기대했을 것입니다. 예를 들어, "X의 변화가 양수이면 Y의 변화도 양수 여야합니다"와 같은 것입니다. 또한 왜 "올바른"행동과 다른 의미를 갖는가?C o v ( X , Y ) = E [ ( X - E [ X ] ) ( Y - E [ Y ] ) ]
보다 탄젠트하지만 여전히 흥미로운 질문은 이러한 속성을 만족시킬 수 있고 여전히 의미 있고 유용했을 다른 정의가 있습니까? 나는 왜 우리가 왜이 정의를 처음에 사용하는지에 대해 의문을 품고 있지 않기 때문에 이것을 묻고있다. (내 생각에 끔찍한 이유이며 과학적이고 수학적 호기심과 사고). 수용된 정의가 우리가 가질 수있는 "최상의"정의입니까?
다음은 수용된 정의가 왜 합리적인지에 대한 나의 생각입니다 (직관적 인 주장 일뿐입니다).
하자 (즉,이 시간에 다른 값에 어떤 값에서 변경) 변수 X에 대한 몇 가지 차이가. 마찬가지로 를 정의 .Δ Y
한 번의 인스턴스에 대해 다음을 수행하여 관련 여부를 계산할 수 있습니다.
이것은 다소 좋다! 한 번에, 그것은 우리가 원하는 속성을 만족시킵니다. 둘 다 함께 증가하면 대부분의 경우 위의 양은 양수 여야합니다 (반대로 유사하면 의 부호가 같기 때문에 음수입니다 ).
그러나 그것은 우리에게 한 번에 하나의 인스턴스에 대해 원하는 양을 제공하며, rv이기 때문에 하나의 관측치에 기초하여 두 변수의 관계를 기반으로 결정하면 초과 적합 할 수 있습니다. 그렇다면 차이점의 "평균적인"결과를보기 위해 이것을 기대해보십시오.
평균 관계가 위에 정의 된 것을 평균적으로 포착해야합니다! 그러나이 설명이 가지고있는 유일한 문제는이 차이점을 어떻게 측정 할 것인가입니다. 이것은 평균과의 차이를 측정하여 해결되는 것으로 보입니다 (어떤 이유로 올바른 일입니다).
나는 정의와 관련된 주요 문제는 평균에서 차이를 취하는 것 같아요 . 나는 그것을 저 자신에게 정당화 할 수없는 것 같습니다.
부호에 대한 해석은 더 복잡한 주제 인 것처럼 보이기 때문에 다른 질문으로 남겨 둘 수 있습니다.