직관 (기하학적 또는 기타)


18

분산의 기본 정체성을 고려하십시오.

Var(X)=E[(XE[X])2]=...=E[X2](E[X])2

중심 모멘트를 중심이 아닌 모멘트로 정의하는 간단한 대수적 조작입니다.

다른 상황에서 를 편리하게 조작 할 수 있습니다. 또한 평균을 계산 한 다음 분산을 계산하기 위해 두 패스가 아닌 단일 패스 데이터를 통해 분산을 계산할 수도 있습니다.Var(X)

그러나 그것은 무엇을 의미 합니까? 나에게 평균 0에 대해 퍼지는 평균에 대한 스프레드와 관련된 즉각적인 기하학적 직관은 없습니다. 는 단일 차원에 대한 집합이므로 평균 주위의 스프레드를 원점과 사각형의 제곱 사이의 차이로 어떻게 볼 수 있습니까? 평균?X

이 선형성에 대한 통찰력을 제공 할 수있는 선형적인 대수 해석, 물리적 해석 또는 기타가 있습니까?



1
@Matthew " "가 무슨 뜻 인지 궁금합니다 . 나는 그것을 의심 하지 하지만 단지 속기 산술 평균에 대한, 기대. 그렇지 않으면 방정식은 부정확합니다 (그리고 임의의 변수를 숫자와 동일시하기 때문에 거의 의미가 없습니다). E
whuber

2
@whuber 내부 제품은 거리와 각도에 대한 아이디어를 소개하고 실제 임의 변수의 벡터 공간의 내부 제품은 (?) 로 정의되므로 기하학적 직관을 통해 어떤 기하학적 직관을 얻을 수 있는지 궁금합니다. 삼각형 불평등. 어떻게 진행해야할지 모르겠지만 그것이 말이되는지 궁금합니다. E[XY]
Antoni Parellada

1
@Antoni 삼각 부등식이 너무 일반적입니다. 내부 제품은 훨씬 더 특별한 대상입니다. 다행히도 적절한 기하학적 직관은 정확하게 유클리드 기하학의 직관입니다. 더욱이, 랜덤 변수 및 의 경우에도 , 필요한 기하학적 구조는 및 의해 생성 된 2 차원 실제 벡터 공간 , 즉 유클리드 평면 자체에 한정 될 수있다 . 본 예에서 는 RV 인 것처럼 보이지 않으며 단지 벡터 일 뿐이다 . 여기서 와 걸쳐있는 공간은 모든 형상이 발생하는 유클리드 평면입니다. Y X Y X n X ( 1 , 1 , , 1 )XYXYXnX(1,1,,1)
우버

3
내가 링크 한 답장에 을 설정 하고 모든 용어를 (원하는 경우)으로 나누면 분산에 대한 완전한 대수적 솔루션을 얻을 수 있습니다. 다시 복사 할 이유가 없습니다. 그것은 이 의 산술 평균 이기 때문입니다 . 는 여기에서 정의한 분산의 배에 불과 합니다. 는 배입니다 제곱 산술 평균이며, 는 제곱 값의 산술 평균의 배입니다. N β 0Y| | Y - Y | | 2N| | Y | | 2N| | y| | 2Nβ^1=0nβ^0y||yy^||2n||y^||2n||y||2n
whuber

답변:


21

주석에서 @whuber의 요점을 확장하면 와 가 직교하면 피타고라스 정리가 있습니다 .ZYZ

Y2+Z2=Y+Z2

그 관찰 유효하다 내적 그 는 해당 내부 제품에 의해 유도 된 표준 입니다.Y = Y,ZE[YZ]Y=E[Y2]

하자 어떤 임의의 변수가 될. 하자 ,하자 . 만약 및 직교 :Y = E [ X ] Z = X E [ X ] Y ZXY=E[X]Z=XE[X]YZ

Y2+Z2=Y+Z2E[E[X]2]+E[(XE[X])2]=E[X2]E[X]2+Var[X]=E[X2]

그리고 보여 쉽게 및 있는 직교 이 내적 미만 :Z = X E [ X ]Y=E[X]Z=XE[X]

Y,Z=E[E[X](XE[X])]=E[X]2E[X]2=0

삼각형의 다리 중 하나는 이고 다른 다리는 이며 빗변은 입니다. 피타고라스 정리는 비정규 랜덤 변수가 평균과 직교하기 때문에 적용될 수 있습니다.E [ X ] XXE[X]E[X]X


기술적 인 말 :

Y = E [ X ] 1 E [ X ] 1 1 = [ 1 , 1 , 1 , , 1 ] Y X 1Y이 예에서 는 실제로 벡터 이어야합니다. 즉, 스칼라 곱하기 상수 벡터 (예 : 이산적이고 유한 한 결과 경우). 는 상수 벡터 에 대한 의 벡터 투영 입니다 .Y=E[X]1E[X]11=[1,1,1,,1]YX1

간단한 예

경우 고려 A는 베르누이 랜덤 변수 여기서 . 우리는 :p = .2Xp=.2

X=[10]P=[.2.8]E[X]=iPiXi=.2

Y=E[X]1=[.2.2]Z=XE[X]=[.8.2]

그리고 사진은 : 여기에 이미지 설명을 입력하십시오

빨간색 벡터 의 제곱 크기 는 의 분산이고 , 파란색 벡터의 제곱 크기는 이며 노란색 벡터의 제곱 크기는 .E [ X ] 2 E [ X 2 ]XE[X]2E[X2]

기억 이 크기, 직교성 등이 ... 보통의 내적에 대한 아니라는 것을 비록 하지만 내적 . 노란색 벡터의 크기는 1이 아니고 0.2입니다.i P i Y i Z iiYiZiiPiYiZi

빨간색 벡터 및 파란색 벡터 는 내부 곱 에서 수직 이지만 소개에서는 수직 이 아닙니다 . 고등학교 기하학 감각. 우리는 일반적인 내적 제품 를 내부 제품으로 사용하지 않는다는 것을 기억하십시오 !Z = X E [ X ] i P i Y i Z i i Y i Z iY=E[X]Z=XE[X]iPiYiZiiYiZi


정말 좋습니다!
Antoni Parellada

1
정답 (+1)이지만 수치가 부족하고 Z가 X이기 때문에 OP에 약간 혼란 스러울 수 있습니다.
amoeba는 Reinstate Monica

@ MatthewGunn, 좋은 대답입니다. 직교성이 유클리드 의미 인 표현에 대해서는 아래의 답변을 확인할 수 있습니다.
YBE

나는 둔하게하는 것을 싫어하지만 , 및 논리의 방향을 똑바로 유지하는 데 어려움을 겪고 있습니다 ( '나에게 이해가되지 않는 장소에서 왔습니다'). 많은 (잘 입증 된) 사실들이 무작위로 언급 된 것 같습니다. 내부 제품은 어떤 공간에 있습니까? 왜 1 입니까? V a r ( X )ZVar(X)
Mitch

@Mitch 논리적 순서는 다음과 같습니다. (1) 확률 공간이 벡터 공간을 정의하는지 확인합니다. 랜덤 변수를 벡터로 취급 할 수 있습니다. (2) 랜덤 변수 와 의 내부 곱을 로 정의하십시오 . 내부 제품 공간에서 벡터 와 는 내부 제품이 0 인 경우 직교로 정의됩니다. (3a) 임의의 변수로 설정하십시오. (3b) 및 하자 . (4) 이런 식으로 정의 된 와 가 직교 함을 관찰하십시오 . (5) 와 이후Z E [ Y Z ] Y Z X Y = E [ X ] Z = X E [ X ] Y Z Y ZYZE[YZ]YZXY=E[X]Z=XE[X]YZYZ피타고라스 정리가 적용된다. (6) 간단한 대 수법에 의해 피타고라스 정리는 동일성과 동일하다.
Matthew Gunn

7

매우 구체적인 시나리오에 대해 순전히 기하학적 인 접근 방식을 사용하겠습니다. 확률 값이 값을 취하는 이산 값 랜덤 변수 를 고려해 봅시다 . 또한이 임의의 변수는 에 벡터, 로 표현 될 수 있다고 가정합니다 . { x 1 , x 2 } ( p 1 , p 2 ) R 2 X = ( x 1 X{x1,x2}(p1,p2)R2X=(x1p1,x2p2)여기에 이미지 설명을 입력하십시오

공지의 길이 제곱 것을 있다 같다 . 따라서 입니다.x 2 1 p 1 + x 2 2 p 2 E [ X 2 ] X = Xx12p1+x22p2E[X2]X=E[X2]

이후 , 벡터의 끝 실제로 타원을 추적한다. 과 가 및 로 다시 매개 변수화되는지 쉽게 알 수 있습니다 . 따라서 및 입니다.X p 1 p 2 cos 2 ( θ ) sin 2 ( θ ) p1+p2=1Xp1p2cos2(θ)sin2(θ)p1=cos(θ)p2=sin(θ)

타원을 그리는 한 가지 방법은 아르키메데스의 Trammel 이라는 메커니즘을 이용하는 것 입니다. 위키에 설명 된대로 : 수직 채널 또는 레일에 한정된 ( "트레 멜링 된") 두 개의 셔틀과로드를 따라 고정 된 위치에서 피벗으로 셔틀에 부착되는로드로 구성됩니다. 셔틀이 채널을 따라 앞뒤로 움직일 때로드의 끝이 타원형 경로로 이동합니다. 이 원칙은 아래 그림에 설명되어 있습니다.

이제 수직 셔틀이 있고 수평 셔틀이 때 각도 가질 때이 트램 멜의 한 인스턴스를 기하학적으로 분석해 봅시다 . 구성으로 인해 및 , (여기서 는 wlog로 가정)B θ | B X | = x 2 | A B | = x 1x 2θ x 1x 2ABθ|BX|=x2|AB|=x1x2θx1x2

여기에 이미지 설명을 입력하십시오

원점 에서 선 에 수직 인 선을 그리자. 하나는 것을 보여줄 수 . 이 특정 랜덤 변수 따라서, 수직 거리원점에서 막대까지는 실제로 표준 편차 .| O C | = ( x 1x 2 ) sin ( θ ) cos ( θ ) V a r ( X )OC|OC|=(x1x2)sin(θ)cos(θ)| OC| σ

Var(X)=(x12p1+x22p2)(x1p1+x2p2)2=x12p1+x22p2x12p12x22p222x1x2p1p2=x12(p1p12)+x22(p2p22)2x1x2p1p2=p1p2(x122x1x2+x22)=[(x1x2)p1p2]2=|OC|2
|OC|σ

우리가에서 세그먼트의 길이를 계산하면 에 : X | C X |CX

|CX|=x2+(x1x2)cos2(θ)=x1cos2(θ)+x2sin2(θ)=x1p1+x2p2=E[X]

삼각형 OCX에 피타고라스 정리를 적용하면

E[X2]=Var(X)+E[X]2.

요약하면 , 값을 취하는 가능한 모든 불연속 랜덤 변수를 설명하는 trammel의 경우 는 원점에서 메커니즘의 끝까지의 거리와 표준 편차입니다. 는로드까지의 수직 거리입니다.{x1,x2} σE[X2]σ

참고 : 가 또는 경우 는 완전히 결정적입니다. 경우 IS 우리는 최대 편차로 끝낸다.0 π / 2 X θ π / 4θ0π/2Xθπ/4


1
+1 좋은 답변. 그리고 확률의 제곱에 벡터를 곱하는 것은 일반적인 확률 성 직교성 개념을 직교로 보이게하는 멋진 / 유용한 트릭입니다!
Matthew Gunn

훌륭한 그래픽. 기호는 모두 의미가 있지만 (타원을 기술 한 트램 멜과 피타고라스의 Thm이 적용됨) 어쨌든 나는 그것이 어떻게 '매직 적으로'순간 (스프레드와 중심)과 관련되는지에 대한 아이디어를 주는지 직관적으로 이해 하지 못하고 있습니다.
Mitch

가능한 모든 값의 랜덤 변수 를 정의하는 프로세스로 trammel을 고려하십시오 . 막대가 수평 또는 수직 일 때 결정적 RV가 있습니다. 중간에는 무작위성이 있으며, 제안 된 기하학적 프레임 워크에서 막대의 원점까지의 거리에 의해 RV (std)가 얼마나 무작위로 측정되는지가 밝혀졌습니다. 타원 곡선이 수학에서 다양한 객체를 연결하기 때문에 더 깊은 관계가있을 수 있지만 수학자가 아니므로 그 연결을 실제로 볼 수는 없습니다. (x1,x2)
YBE

3

다음과 같이 재 배열 할 수 있습니다.

Var(X)=E[X2](E[X])2E[X2]=(E[X])2+Var(X)

그런 다음 다음과 같이 해석하십시오. 랜덤 변수의 예상 제곱은 평균의 제곱에 평균의 예상 제곱 편차를 더한 것과 같습니다.


오. 허. 단순한. 그러나 정사각형은 여전히 ​​해석되지 않은 것 같습니다. 나는 사각형이없는 것이 의미가 있음을 의미합니다 (정렬하게 느슨하게).
Mitch

3
나는 이것에 팔리지 않았다.
Michael R. Chernick

1
피타고라스 정리가 적용되는 경우, 어떤 변을 갖는 삼각형은 무엇이며 두 다리는 어떻게 수직입니까?
Mitch

1

정교하고 적절한 답변을 제공 할 수있는 기술이 없어서 미안하지만 그 대답은 물리적 고전 역학 개념 순간, 특히 0 중심의 "원시"순간과 평균 중심 중심 순간 사이의 변환에 있다고 생각합니다. 분산은 랜덤 변수의 2 차 중심 모멘트임을 명심하십시오.


1

일반적인 직관은 두 모멘트가 수직이고 세 번째는 빗변이라는 것을 보여줌으로써 피타고라스 정리 (PT)를 적절히 정의 된 벡터 공간에서 사용하여 이러한 모멘트를 연관시킬 수 있다는 것입니다. 필요한 대수학은 두 다리가 실제로 직교 함을 보여주는 것입니다.

다음을 위해 전체 분포의 모멘트가 아니라 계산 목적의 표본 평균 및 분산을 의미한다고 가정합니다. 그건:

E[X]=1nxi,mean,first central sample momentE[X2]=1nxi2,second sample moment (noncentral)Var(X)=1n(xiE[X])2,variance,second central sample moment

(모든 합계가 개가 넘는 항목).n

참고로, 기본 증명서의 인 추진 단지 기호 : V R ( X )Var(X)=E[X2]E[X]2

Var(X)=1n(xiE[X])2=1n(xi22E[X]xi+E[X]2)=1nxi22nE[X]xi+1nE[X]2=E[X2]2E[X]2+1nnE[X]2=E[X2]E[X]2

여기에는 의미가 거의 없으며 대수의 기본 조작 만 있습니다. 가 요약 내에서 상수 임을 알 수 있지만 그 정도입니다.E[X]

이제 벡터 공간 / 형상 해석 / 직관에서 PT에 해당하는 약간 재정렬 된 방정식입니다.

Var(X)+E[X]2=E[X2]

따라서 n 항목 의 샘플 인 R n 의 벡터로 고려 하십시오 . 그리고 두 개의 벡터 E [ X ] 1X - E [ X ] 1을 만들어 봅시다 .XnRnE[X]1XE[X]1

벡터 은 모든 좌표의 샘플 평균을 갖습니다.E[X]1

벡터 X 1 - E [ X ] , ... , X N - E [ X ] .XE[X]1x1E[X],,xnE[X]

두 벡터의 내적은 0으로 밝혀지기 때문에이 두 벡터는 수직입니다 :

E[X]1(XE[X]1)=E[X](xiE[X])=(E[X]xiE[X]2)=E[X]xiE[X]2=nE[X]E[X]nE[X]2=0

따라서 두 벡터는 직각이므로 직각 삼각형의 두 다리입니다.

그런 다음 PT ( 을 보유 )에 의해 두 다리 길이의 제곱의 합은 빗변의 제곱과 같습니다.Rn

상단의 지루한 대수 증명에 사용 된 동일한 대수에 의해 가 빗변 벡터의 제곱 임을 알 수 있습니다 .E[X2]

여기서 제곱은 내적입니다 (실제로 E [ x ] 1 이고 ( X - E [ X ] ) 2 V a r ( X ) 입니다 ) .(XE[X])2+E[X]2=...=E[X2]E[x]1(XE[X])2Var(X)

이 해석에 대한 흥미로운 부분은 샘플에서의 변환이다 의 벡터 공간에 단 변량 분포에서 항목 N 차원. 이 유사하다 n은 정말 두 샘플로 해석되는 이변 샘플 n 개의 변수.nnnn

어떤 의미에서, 벡터와 의 직각 삼각형 은 hypotnenuse로 나타납니다. 이 값에 대한 해석 (벡터)을 제공하고 해당 값이 일치 함을 보여줍니다. 그것은 충분히 시원하지만 통계적으로나 기하학적으로 비현실적입니다. 그것은 실제로 우리가 처음에 이미 가지고 있었던 순수한 대수적 증거를 재현하기 위해 많은 추가적인 개념적 기계가 될 것이며 그렇게 말하지 않을 것입니다.E[X2]

또 다른 흥미로운 부분은 평균과 분산이 직관적으로 중심을 측정하고 한 차원으로 확산되지만 차원 에서 직교한다는 것 입니다. 그것들이 직교한다는 것은 무엇을 의미합니까? 몰라요! 직교하는 다른 순간이 있습니까? 이 직교성을 포함하는 더 큰 관계 시스템이 있습니까? 중앙 모멘트 대 비 중심 모멘트? 몰라요!n


또한 표면적으로 유사한 바이어스 편차 트레이드 오프 방정식의 해석 / 직관에 관심이 있습니다. 거기에 힌트가 있습니까?
Mitch

piipi=1nipiXiYi=1niXiYiE[XY]XYnipi=1nE[XY]=ipiXiYinE[XY]Pipi=1n

x^y^x^i=xipiy^i=xipix^y^=ixipiyipi=ipixiyi=E[xy]x^y^E[xy]
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.