우선, 나는 이것을 묻지 않습니다.
제로 상관 관계가 독립성을 의미하지 않는 이유는 무엇입니까?
이것은 /math/444408/why-does-zero-correlation-not-imply-independence 에서 (아주 멋지게) 해결 되었습니다.
내가 묻는 것은 반대입니다 ... 두 변수는 서로 독립적입니다.
우연히 작은 상관 관계를 가질 수 없었습니까?
... 독립성이 매우 작은 상관 관계를 암시해서는 안됩니까?
우선, 나는 이것을 묻지 않습니다.
제로 상관 관계가 독립성을 의미하지 않는 이유는 무엇입니까?
이것은 /math/444408/why-does-zero-correlation-not-imply-independence 에서 (아주 멋지게) 해결 되었습니다.
내가 묻는 것은 반대입니다 ... 두 변수는 서로 독립적입니다.
우연히 작은 상관 관계를 가질 수 없었습니까?
... 독립성이 매우 작은 상관 관계를 암시해서는 안됩니까?
답변:
상관 계수의 정의에 따라 두 변수가 독립적이면 상관 관계는 0입니다. 따라서 우연히 상관 관계가 발생하지 않았습니다!
경우 및 독립적 인 수단 . 따라서이 경우 의 분자 는 0입니다.
따라서 여기에서 언급 한 것처럼 상관 관계의 의미를 변경하지 않으면 불가능합니다. 그렇지 않으면 상관 관계가 무엇인지 정의를 명확히하십시오.
set.seed(616)
r = replicate( 10^6, cor(rexp(5), rexp(5)) )
mean(abs(r) > .5)
[1] 0.386212
mean(r)
[1] -0.0005904455
hist(r, prob=T, br=40, col="skyblue2")
abline(v=c(-.5,.5), col="red", lwd=2)
이와 관련하여 지수 분포에 특별한 것은 없습니다. 모 분포를 표준 정규로 변경하면 다음과 같은 결과가 나타납니다.
set.seed(2019)
...
mean(abs(r) > .5)
[1] 0.391061
mean(r)
[1] 1.43269e-05
어쩌면 이것은 동일한 직관적 이해를 공유하는 일부 사람들에게 도움이 될 수 있습니다. 우리는 모두 다음과 같은 것을 보았습니다.
이 데이터는 아마도 독립적이지만 분명히 상관 관계를 나타냅니다 (). "독립성은 무의미한 상관 관계를 의미한다고 생각했습니다!" 학생이 말합니다.
다른 사람들이 이미 지적했듯이 샘플 값은 상관되어 있지만 모집단 이 0이 아닌 상관 관계를 의미하지는 않습니다 .
물론이 두 개는 독립적이어야합니다. 니콜라스 케이지가 올해 기록적인 10 편의 영화에 출연했기 때문에 안전을 위해 여름에 수영장을 닫지 말아야합니다.
그러나 올해 얼마나 많은 사람들이 익사했는지 확인하면 올해 1000 명에 달하는 기록적인 사람들이 익사 할 가능성이 적습니다.
이러한 상관 관계를 얻는 것은 거의 불가능합니다. 아마도 천명 중 하나 일 것입니다. 그러나 두 사람이 독립적이더라도 가능합니다. 그러나 이것은 단지 하나의 경우입니다. 거기에서 측정 할 수있는 수백만 가지의 사건이 있다고 가정하면, 두 가지가 높은 상관 관계를 제공 할 가능성이 매우 높다는 것을 알 수 있습니다 (따라서 위와 같은 그래프가 존재 함).
이를 확인하는 또 다른 방법은 두 개의 독립적 인 이벤트가 항상 상관되지 않은 값을 제공하도록 보장하는 것 자체가 제한적이라는 것입니다. 두 개의 독립적 인 주사위와 첫 번째의 결과가 주어지면, 두 번째 주사위에 대해 일정한 (크기 조정 가능) 결과 세트가 있으며, 이는 0이 아닌 상관 관계를 제공합니다. 첫 번째 주사위의 롤이 결과 분포에 영향을 미치기 때문에 두 번째 주사위의 결과가 첫 번째 주사위와 0의 상관 관계를 갖지 않도록 제한하는 것은 명백한 독립 위반입니다.