분산의 선형성


16

다음 두 가지 공식이 사실이라고 생각합니다.

Var(aX)=a2Var(X)
a는 상수이고 경우, , 독립적
Var(X+Y)=Var(X)+Var(Y)
XY

그러나 아래에 어떤 문제가 있는지 잘 모르겠습니다.

Var(2X)=Var(X+X)=Var(X)+Var(X)
같지 않음 , 즉 입니다.4 V a r ( X )22Var(X)4Var(X)

이 것을 가정하면 인구에서 가져온 샘플입니다, 우리가 항상 가정 할 수 있다고 생각 다른 독립적으로 의.X XXXX

내 혼란에 어떤 문제가 있습니까?


8
분산은 선형 적이 지 않습니다-첫 번째 진술은 이것을 보여줍니다 (만약 당신이 가질 것 입니다. 반면에 공분산은 쌍 선형입니다Var(aX)=aVar(X)
Batman

답변:


33

당신의 추론의 문제는

"저는 항상 가 다른 독립적 이라고 가정 할 수 있습니다 ."XXX

X X X X Y X 1 X 2X 독립적이지입니다 . 여기서 기호 는 동일한 임의의 변수를 나타내는 데 사용됩니다. 수식에 나타날 첫 번째 X 의 값을 알고 나면 두 번째 의 값도 표시됩니다. 고유 한 (및 잠재적으로 독립적 인) 임의 변수를 참조하려면 다른 문자 (예 : 및 ) 또는 아래 첨자 (예 : 및 )로 변수를 표시해야합니다 . 후자는 종종 같은 분포에서 도출 된 변수를 나타내는 데 사용되지만 항상 그런 것은 아닙니다.XXXXXYX1X2

두 변수 와 가 독립적 인 경우 는 같습니다. 값을 알면 값에 대한 추가 정보가 제공되지 않습니다 . 그러나 인 경우 와 의 값을 알고 : 그렇지 않으면 당신의 가치에 대한 완전한 정보 제공 . [이 단락의 확률은 누적 분포 함수 또는 적절한 경우 확률 밀도 함수로 본질적으로 동일한 효과로 대체 할 수 있습니다.]Y Pr ( X = a | Y = b ) Pr ( X = a ) Y X Pr ( X = a | X = b ) 1 a = b 0 X XXYPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0XX

사물을 보는 또 다른 방법은 두 변수가 독립적 인 경우 상관 관계가 0 이지만 ( 제로 상관 관계는 독립성을 의미하지는 않지만!) 는 자체와 완벽하게 상관되어 있습니다. 이므로 는 자체적으로 독립적. 참고 그 이후 공분산은 로 주어진다 다음Corr ( X , X ) = 1 X Cov ( X , Y ) = Corr ( X , Y ) XCorr(X,X)=1X Cov(X,X)=1Cov(X,Y)=Corr(X,Y)Var(X)Var(Y)

Cov(X,X)=1Var(X)2=Var(X)

두 랜덤 변수의 합 분산에 대한보다 일반적인 공식은 다음과 같습니다.

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

특히 이므로Cov(X,X)=Var(X)

Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)

규칙 적용에서 추론했을 때와 동일합니다.

Var(aX)=a2Var(X)Var(2X)=4Var(X)

선형성에 관심이 있다면 공분산 의 이중성 에 관심이있을 수 있습니다 . 랜덤 변수 , , 및 (종속 또는 독립) 및 상수 , , 및 경우X Y Z a b c dWXYZabcd

Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)

Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)

전반적으로

Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)

그런 다음 이것을 사용하여 게시물에 작성한 분산에 대한 (비선형) 결과를 증명할 수 있습니다.

Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)

Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y)

후자는 일 때 특별한 경우로 ,a=b=1

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

경우 및 (가 독립적 인 경우를 포함)를 무상관, 이것은로 감소 . 따라서 "선형"방식으로 분산을 조작하려면 (대수적으로 대수적으로 작업하는 것이 좋은 방법 임) 대신 공분산을 사용하여 쌍 선성을 활용하십시오.XYVar(X+Y)=Var(X)+Var(Y)


1
예! 처음에는 혼란이 본질적으로 표기법이라는 것을 정확히 지적했다고 생각합니다. 한 책 (매우 명시 적으로, 일부는 힘들게 말할 수도 있음)이 확률 론적 진술을 해석하고 평가하는 규칙을 설명했을 때 매우 유용하다는 것을 알았습니다 (예를 들어 여기서 에서 크랩에 을 던지는 것을 고려하면 기술적으로 올바르지 않습니다 (그리고 는 홀수 롤을 생성하지 않습니다). iid를 사용하여 올바르게 표현 ). Pr(X+X=n)XUniform(1..6)nX+X=2XX1,X2
Vandermonde

1
이 대조적이다 (그리고 나는 나의 오해가 막아야 것 같아) 얼마나 2+PRNG(6)+PRNG(6)자주 입니다 당신은 / 같은 규칙 위 및 / 또는 표기법으로 주사위를 던져 얼마나 서로 다른 사례가 진정으로 독립적 인 . 2d6=d6+d6
Vandermonde

@Vandermonde 흥미로운 점입니다. 처음에는 "다른 "를 구별하기 위해 아래 첨자를 사용하는 것을 고려 했지만 귀찮게하지 않았습니다. 지금 편집 할 수있을 것 같습니다. "합계가 라면 홀수 총점을 얻지 못할 것"이라는 주장 은 매우 명확하고 구별 할 필요가없는 사람에게 확신을줍니다. 공유해 주셔서 감사합니다. X2X
Silverfish

0

그것에 대해 생각하는 또 다른 방법은 무작위 변수 입니다.2XX+X

2X 는 결과 값의 두 배를 의미 하는 반면, 는 두 번의 시행을 의미 합니다. 다시 말해, 다이를 한 번 굴리는 것과 결과를 두 배로하는 것과 다이를 두 번 굴리는 것의 차이입니다.XX+XX


+1 이것은 완전히 명확하고 정답입니다. 우리 사이트에 오신 것을 환영합니다!
whuber

감사합니다 @ whuber!
Benjamin
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.