변수 내에서 분산과 쌍별 거리 사이의 링크


20

우리는 두 변수 (동일 샘플 크기)이 있으면 증명주십시오 Y분산 에서 X가 보다 큰 Y 후, 제곱 된 차이의 합 내의 데이터 포인트 사이의 (유클리드 거리 제곱 IE) X 또한보다 큰 Y 내에서 .XYXYXY


1
명확히하십시오 : 당신이 분산 을 말할 때 , 표본 분산 을 의미 합니까? 제곱 차이의 합 을 말할 때 당신 은 합니까?i,j(xixj)2
추기경

9
전술 한 경우 : 주의 십자가 용어의 요소를 차지하여. 나는 당신이 (작은 간격)을 채울 수 있다고 생각합니다. 결과는 사소하게 따릅니다.
i,j(xixj)2=ij((xix¯)(xjx¯))2=2ni=1n(xix¯)2,
추기경

2
X 2F (정의 된 분산) 에서 iid 이면 E ( X 1 - X 2 ) 2 = 2 V 라는 사실을 고려하여 계산없이 "이없이"수행 할 수있는 방법도 있습니다. a r ( X 1 ) . 그러나 확률 개념에 대해 약간 더 확고한 이해가 필요합니다. X1X2FE(X1X2)2=2Var(X1)
추기경

1
관련 질문에 대해, 나는 stats.stackexchange.com/a/18200 의 답장에서 여기에서 일어나는 일의 시각화를 사용했습니다 : 제곱 차이는 제곱의 영역입니다.
whuber

1
@ whuber : 아주 좋아요. 어떻게 든 나는 당신의 대답을 놓쳤다.
추기경

답변:


5

"공식적인"답변을 제공하기 위해 의견에 스케치 된 솔루션을 보완하기 위해

  1. Var((Xi))Var((Yi))i,j(XiXj)2i,j(YiYj)2 are changed by shifting all Xi uniformly to Xiμ for some constant μ or shifting all Yi to Yiν for some constant ν. Thus we may assume such shifts have been performed to make Xi=Yi=0, whence Var((Xi))=Xi2 and Var((Yi))=Yi2.

  2. After clearing common factors from each side and using (1), the question asks to show that Xi2Yi2 implies i,j(XiXj)2i,j(YiYj)2.

  3. Simple expansion of the squares and rearranging the sums give

    i,j(XiXj)2=2Xi22(Xi)(Xj)=2Xi2=2Var((Xi))
    with a similar result for the Y's.

The proof is immediate.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.