경계 랜덤 변수의 분산


22

랜덤 변수의 하한과 상한이 [0,1]이라고 가정합니다. 그러한 변수의 분산을 계산하는 방법은 무엇입니까?


8
제한되지 않은 변수와 같은 방식으로 적분 또는 합산 한계를 적절하게 설정합니다.
Scortchi-Monica Monica 복원

2
@Scortchi가 말했듯이. 그러나 왜 당신이 그것이 다를 수 있다고 생각했는지 궁금합니다.
Peter Flom-Monica Monica 복원

3
변수에 대해 아무것도 모르는 경우 (이 경우 편차의 상한이 경계의 존재로부터 계산 될 수 있음) 변수가 경계에 있다는 사실이 계산에 나오는 이유는 무엇입니까?
Glen_b-복원 모니카

6
유용한는 상부의 값을 취하는 확률 변수의 분산에 결합 [a,b] 확률이 1(ba)2/4 및 값을 취 이산 확률 변수에 의해 달성된다 및 B 등호 확률 1ab12 . 명심해야 할 또 다른 요점은 분산이 존재 함을 보장하는 반면, 무한한 랜덤 변수는 분산을 갖지 않을 수 있다는 것입니다 (예 : Cauchy 랜덤 변수는 평균을 갖지 않음).
Dilip Sarwate

7
거기 이고 그 차이에 해당 이산 확률 변수 (ba)24 정확히 4 :확률이 같은값a를 취하는 랜덤 변수1b12 . 따라서, 우리는 적어도 분산에 대한 보편적 인 상한이(ba)2보다 작을 수 없다는 것을 알고 있습니다(ba)24 .
Dilip Sarwate

답변:


46

Popoviciu의 불평등을 다음과 같이 증명할 수 있습니다. m=infX 및 표기법을 사용하십시오 . 로 함수 를 정의하십시오 미분 계산 및 해결 우리가 발견 에서 최소 달성 ( )에 유의하십시오 .M=supXg

g(t)=E[(Xt)2].
g
g(t)=2E[X]+2t=0,
gt=E[X]g>0

이제 특수 지점 에서 함수 의 값을 고려하십시오 . 이어야합니다 그러나 이후 및 , 우리가 암시하는 gt=M+m2

Var[X]=g(E[X])g(M+m2).
g(M+m2)=E[(XM+m2)2]=14E[((Xm)+(XM))2].
Xm0XM0
((Xm)+(XM))2((Xm)(XM))2=(Mm)2,
14E[((Xm)+(XM))2]14E[((Xm)(XM))2]=(Mm)24.
V a r [ X ] ( M - m ) 2 따라서 우리는 Popoviciu의 불평등 ,을 증명했습니다
Var[X](Mm)24.


3
좋은 접근 방식 : 이런 종류의 것들에 대한 엄격한 데모를 보는 것이 좋습니다.
whuber

22
+1 니스! 컴퓨터가 유행하기 오래 전에 통계를 배웠고 우리에게 뚫린 한 가지 아이디어는 편리한 점 에서 편차의 제곱의 합을 찾아서 바이어스를 조정하여 분산 계산을 허용합니다 . 물론,이 정체성은 가 파생물 등의 필요없이 에서 최소값을 t g ( t ) t = μ
E[(Xt)2]=E[((Xμ)(tμ))2]=E[(Xμ)2]+(tμ)2
tg(t)t=μ
가졌다

18

[ 0 , 1 ] 의 분포라고 하자 . F 의 분산 이 최대 인 경우 F 는 내부를지지 할 수 없으며 , F 는 베르누이이고 나머지는 사소한 것입니다.F[0,1]FFF

표기법 말하자면,하자 K 원료의 모멘트 일 F (그리고, 평소와 같이, 우리는 물품 μ = μ 1σ는 2 = μ 2 - μ 2 대 차이).μk=01xkdF(x)kFμ=μ1σ2=μ2μ2

우리는 가 한 시점에서 모든 지원을 제공하지 않는다는 것을 알고 있습니다 (이 경우 편차는 최소 입니다). 무엇보다도 이것은 μ01 사이에 있다는 것을 의미 합니다. 모순으로 논쟁하기 위해 F ( I ) > 0 인 내부 ( 0 , 1 ) 에 측정 가능한 하위 집합 I 이 있다고 가정 합니다. 일반성을 잃지 않으면 서 우리는 ( 필요한 경우 X1 - X 로 변경 하여 ) F ( J = IFμ01I(0,1)F(I)>0X1X : 즉, J 는평균 이상의 I 부분을 ​​차단하여 얻어지며 J 는 양의 확률을 갖습니다.F(J=I(0,μ])>0JIJ

J 에서 모든 확률을 취하여 0에 놓아서 F ' 로 바꾸자 . FFJ0 그렇게하면 μk

μk=μkJxkdF(x).

표기법의 문제로, 그러한 적분에 대해 를 쓰겠습니다.[g(x)]=Jg(x)dF(x)

μ2=μ2[x2],μ=μ[x].

계산하다

σ2=μ2μ2=μ2[x2](μ[x])2=σ2+((μ[x][x2])+(μ[x][x]2)).

오른쪽의 두 번째 항 J의 모든 곳에서 μ x 이므로 음수가 아닙니다 . 오른쪽의 첫 번째 용어를 다시 쓸 수 있습니다(μ[x][x]2)μxJ

μ[x][x2]=μ(1[1])+([μ][x][x2]).

오른쪽 첫 번째 항은 엄격하게 (a) 때문에 양의 및 (b) [ 1 ] = F ( J는 ) < 1 우리가 가정하기 때문에 F가 점에 집중하지 않는다. 이 같이 재기록 될 수 있기 때문에 두 번째 항은 음수이다 [ ( μ - X ) ( X ) ] ,이 적분은 가정에서 음수 인 μ XJ0 X 1μ>0[1]=F(J)<1F[(μx)(x)]μxJ0x1. 다음은 입니다.σ2σ2>0

우리는 가정하에 F '로 변경 하면 그 편차가 엄격하게 증가한다는 것을 알았습니다. 그러므로 이것이 일어날 수없는 유일한 방법은 F ' 의 모든 확률이 종말점 01에 집중 될 때 (예 : 값 1 - pp )입니다. 그 차이를 용이하게 동일하게 산출 P ( 1 - P ) 할 때 최대이다 P = 1 / 2 과 같 1 / 4 이.FF F011ppp(1p)p=1/21/4

이제 [ a , b ] 의 분포 일 때 최근에이를 [ 0 , 1 ] 의 분포로 재조정합니다 . 최근 조정은 분산을 변경하지 않지만 크기 조정은이를 ( b - a ) 2로 나눕니다 . , 따라서 F 의 최대 편차를 가진 [ , B ] 의 최대 편차를 가진 분포에 대응하는 [ 0 , 1 ] :이 때문에 베르누이 인 ( 1 / 2 )F[a,b][0,1](ba)2F[a,b][0,1](1/2)재배 율화 분포로 변환하고 를 갖는 분산 ( B - ) 2 / 4 , QED .[a,b](ba)2/4


흥미 롭군 나는이 증거를 몰랐다.
Zen

6
@ 젠 그것은 당신만큼 우아하지 않습니다. 나는 훨씬 더 복잡한 분포 불평등에 직면했을 때 이런 식으로 생각하면서 수년 동안 나 자신을 발견했기 때문에 그것을 제안했다. 나는 불평등을 더 극단적으로 만들기 위해 확률이 어떻게 변할 수 있는지 묻는다. 직관적 인 휴리스틱으로 유용합니다. 여기에 제시된 것과 같은 접근법을 사용함으로써, 나는 다양한 종류의 불평등을 증명하기위한 일반적인 이론이 변형의 미적분학과 (유한 차원) 라그랑주 승수 기법의 하이브리드 풍미와 함께 도출 될 수 있다고 생각합니다.
whuber

완벽 : 답변은 다른 많은 경우를 처리하는 데 사용할 수있는보다 일반적인 기술을 설명하므로 중요합니다.
Zen

@whuber는 말했다- "불평등을보다 극단적으로 만들기 위해 확률이 어떻게 변할 수 있는지 묻습니다." -이런 문제에 대해 생각하는 자연스러운 방법 인 것 같습니다.
Glen_b-복지 주 모니카

파생에는 몇 가지 실수가있는 것 같습니다. 이 있어야 또한 [ ( μ x ) ( x ) ][ μ ] [ x ]와 같지 않습니다 .
μ[x][x2]=μ(1[1])[x]+([μ][x][x2]).
[(μx)(x)] 이후 [ μ ] [ X ]는 동일하지 않다 μ [ X ][μ][x][x2][μ][x]μ[x]
레오

13

랜덤 변수가 로 제한되고 평균 μ = E [ X ]를 알고있는 경우 분산은 ( b - μ ) ( μ - a )에 의해 제한됩니다 .[a,b]μ=E[X](bμ)(μa)

먼저 고려해 봅시다 . 모든 x [ 0 , 1 ] , x 2x 이므로 E [ X 2 ] E [ X ] 입니다. 이 결과를 사용하여 σ 2 = E [ X 2 ] - ( E [ X ] 2 ) = E [ X 2 ]a=0,b=1x[0,1]x2xE[X2]E[X]

σ2=E[X2](E[X]2)=E[X2]μ2μμ2=μ(1μ).

간격으로 일반화 B > 고려 Y가 제한 [ , B ] . X = Y a로 정의[a,b]b>aY[a,b] .[0,1]로제한됩니다. 마찬가지로,Y=(b-a)X+a이므로 Var[Y]=(b-a)2Var[X](b-a)2μX(1-μX).X=Yaba[0,1]Y=(ba)X+a

Var[Y]=(ba)2Var[X](ba)2μX(1μX).
불평등은 첫 번째 결과에 기초한다. 이제 μ X = μ Ya 를 대입 하여 , 경계는(ba)2와 같습니다. μX=μYaba 원하는 결과입니다.
(ba)2μYaba(1μYaba)=(ba)2μYababμYba=(μYa)(bμY),

8

@ user603의 요청에서 ...

σ2[a,b]1σ2(ba)24a=0,b=1ab12(ba)24

명심해야 할 또 다른 요점은 경계 랜덤 변수에 유한 분산이있는 반면, 무한 랜덤 변수의 경우 분산이 유한하지 않을 수 있으며 경우에 따라 정의 할 수도 없을 수도 있다는 것입니다. 예를 들어, Cauchy random variables에 대해 평균을 정의 할 수 없으므로 분산을 정의 할 수 없습니다 (평균과의 제곱 편차가 예상 됨).


이것은
@Juho

의견 일 뿐이지 만이 답변이 질문에 대한 답변을 제공하지 않는다고 덧붙일 수도 있습니다.
Aksakal

@Aksakal 그래서 ??? Juho는 약간 다르고 훨씬 최근에 묻는 질문에 대답했습니다. 이 새로운 질문은 위에서 본 질문과 합쳐져 10 개월 전에 답변했습니다.
Dilip Sarwate

0

[a,b]

Var(X)=E[(XE[X])2]E[(ba)2]=(ba)2.
1/4

1/4

이 기사 는 Wikipedia 기사보다 더 좋아 보입니다 ...

Var(X)=(ba)212.

이 페이지는 "선형 프로그래밍의 기본 정리"에 대한 이해가 필요한 것 같아서 약간의 증명이 시작되어 결과가 나와 있습니다. sci.tech-archive.net/Archive/sci.math/2008-06/msg01239.html
Adam Russell

이것에 이름을 넣어 주셔서 감사합니다! "Popoviciu의 불평등"은 내가 필요한 것입니다.
Adam Russell

2
1/4

2
연속 분포는 개별적으로 (cdf 용어로) 개별적으로 접근 할 수 있습니다 (예 : 적절한 영역의 각 질량 지점에 중심에 작은 Beta (4,4) 모양의 커널을 배치하여 주어진 개별 디스크로부터 연속 밀도를 구성합니다- 각 커널의 표준 편차는 면적을 일정하게 유지하면서 0으로 줄어 듭니다. 여기서 논의 된 이러한 불연속 경계는 또한 연속 분포에 대한 경계로서 작용할 것이다. 나는 당신이 지속적인 단봉 분포 에 대해 생각하고 있습니다 ... 실제로 상한이 다릅니다.
Glen_b-복지 주 모니카

2
글쎄 ... 내 대답은 가장 도움이되지 않았지만 좋은 의견 때문에 여기에 남겨 둘 것입니다. 건배, R
Ric
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.