분산의 역함수


9

주어진 상수 (예 : 4)에 대해 에 대한 확률 분포를 찾을 수 있으므로 ?rXVar(X)=r


1
추가 정보가없는 한 아닙니다.
Hemant Rupani

@Hemant Rupani 어떤 추가 정보가 필요합니까?
amiref

1
랜덤 변수 'X'의
본질

3
"X에 대한 값"을 "X에 대한 분포"로 바꾸도록 질문을 편집하는 것이 좋습니다. X에 단일 값이있는 경우 X는 분포변형 되고 분산이 0이됩니다.
Silverfish

1
하지 않는 한 부정적 인 대답은 분명히 '예, 분산은 양수가 될 수 있습니다. r
dsaxton

답변:


13

의 경우를주의 깊게 고려하십시오 . 이면 분포가 퇴화되지만 는 평균을 가질 수 있습니다. 즉, 대해 및 입니다 . 따라서 에 대해 가능한 많은 분포를 찾을 수 있지만 의해 색인화되고 완전히 지정됩니다 .rr=0XPr(X=μ)=1Pr(X=c)=0cμXμR

경우 어떠한 분포 때문에, 발견되지 .r<0Var(X)=E(XμX)20

들어 , 대답은 추가 정보가에 대해 알려진에 따라 달라집니다 . 예를 들어, 가 평균 인 것으로 알려진 경우 , 및 대해 을 취함으로써 이러한 모멘트를 갖는 분포를 찾을 수 있습니다 . 이것은 평균과 분산을 일치시키는 문제에 대한 유일한 해결책은 아니지만, 정규 분포가 유일하게 분산 된 솔루션입니다 (그리고 가능한 모든 솔루션 중에서 이것은 Daniel이 지적한 것처럼 엔트로피를 최대화하는 솔루션입니다). 예를 들어 세 번째 중심 모멘트 이상 을 일치 시키려면 더 넓은 범위의 확률 분포를 고려해야합니다.r>0XXμμRr>0XN(μ,r)

대신 의 순간보다는 의 분포에 대한 정보가 있다고 가정하십시오 . 예를 들어, 가 Poisson 분포를 따른다는 것을 알고 있다면 고유 한 솔루션은 입니다. 가 지수 분포를 따른다는 것을 알고 있다면 , 고유 한 솔루션 . 여기서 을 해결하여 모수를 찾았습니다 .XXXPoisson(r)XXExponential(1r)Var(X)=r=1λ2

다른 경우에는 전체 솔루션 제품군을 찾을 수 있습니다. 가 직사각형 (연속 균일 분포) 분포를 따른다는 것을 알면 를 풀어 분포 의 고유 너비 를 찾을 수 있습니다 . 그러나 의해 매개 변수화 된 의 전체 솔루션 계열이있을 것 입니다.이 세트의 분포는 모두 서로의 번역입니다. 마찬가지로 가 정규이면 모든 분포 이 작동합니다 (따라서 우리는 색인 된 전체 솔루션 세트를 갖습니다 . 이는 다시 임의의 실수가 될 수 있으며 패밀리는 모두 번역입니다) 서로의). 만약XwVar(X)=r=w212XU(a,a+w)aRXXN(μ,r)μX 다음 감마 분포 형상 스케일 파라미터를 사용하고, 우리는 솔루션의 가족을 얻을 수 있고, 에서 parametized . 이 가족의 구성원은 서로의 번역이 아닙니다. "솔루션 계열"이 어떻게 보이는지 시각화하기 위해 색인화 된 정규 분포의 예 와 색인화 된 감마 분포 ( 예 : 의 예 : 에 해당) 당신의 질문.XGamma(rθ2,θ)θ>0μθr=4

분산이 4 인 정규 분포 분산이 4 인 감마 분포

반면에 일부 분포의 경우 값에 따라 해를 찾는 것이 가능하지 않을 수도 있습니다 . 예를 들어 만약 에 대해 다음 베르누이 변수이어야 두 가지 해결책이 존재 개의 확률이 있기 때문에 방정식을 해결 이고 실제로이 두 확률은 상보 적입니다. 즉 입니다. 들면 에만 고유 용액가 , 및 대한 더 베르누이 분포는 충분히 높은 변화가 없다.rX0r<0.25XBernoulli(p)pVar(X)=r=p(1p)p1+p2=1r=0.25p=0.5r>0.25

나는 케이스를 언급해야한다고 생각합니다 . 이 경우에 대한 해법도 있습니다 (예 : 자유도가 2 인 스튜던트 분포) .r=t

플롯의 R 코드

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1)) 

17

뜻 가정하면 "것이 가능 찾는 것입니다 확률 분포 에 대한 당신이 것을 어떤 기준을 지정하지 않은 것처럼"그 대답은 '예' 만족해야합니다. 실제로이 조건을 만족시킬 수있는 무한한 분포가 있습니다. 정규 분포 . 당신은 설정할 수 있습니다 하고 처럼 어떤 값을 취할 수 - 당신이 다음 것이다 필요에 따라.XXN(x;μ,σ2)σ2=rμVar[X]=r

실제로, 정규 분포는 주어진 평균과 분산에 대한 최대 엔트로피 확률 분포 이므로 이와 관련하여 다소 특별 합니다.


당신 말이 맞아요 더 설명해 주시겠습니까?
amiref

@AmirEf 명확하지 않은 것은 무엇입니까?
Daniel

6
다니엘이 무엇을 더 설명해야하는지 분명하지 않습니다. 여기의 답변은 게시 된 질문의 모든 내용을 다루는 것 같습니다.
Glen_b-복지국 모니카

15

이 질문은 흥미롭고 완전히 사소한 것이 아닌 방식으로 해석 될 수 있습니다. 임의의 변수처럼 보이는 가 주어지면 , 분산이 미리 지정된 수 과 같은 방식으로 확률을 값에 할당하거나 기존 확률을 주변으로 이동시킬 수 있습니까? 대답은 가능한 모든 값 이 허용되며 최대 범위는 범위에 의해 결정됩니다 .Xrr0X

이러한 분석에 대한 잠재적 관심은 특정 목표를 달성하기 위해 확률 변수를 변경하고 임의 변수를 고정 된 상태로 유지하는 아이디어에 있습니다. 이 응용 프로그램은 간단하지만 수학 재무의 기본 결과 인 Girsanov 정리의 기본 아이디어를 표시합니다 .


이 질문을 엄격하고 모호하지 않은 방식으로 다시 설명하겠습니다. 가정

X:(Ω,S)R

sigma-algebra 로 측정 공간 에 정의 된 측정 가능한 함수 입니다. 주어진 실수 , 이 공간에서 확률 측정 를 언제 찾을 수 있습니까?ΩSr>0PVar(X)=r

대답은 때 가능하다는 것 입니다. sup(X)inf(X)>2r (최고와 부정이 모두 달성되면 평등을 유지할 수 있습니다. 즉, 실제로 의 최대 값과 최소값입니다 .) 또는 인 경우이 조건 제한을 두지 않으면 음수가 아닌 모든 분산 값이 가능합니다.Xsup(X)=inf(X)=r

증거는 건설에 의한 것입니다. 간단한 버전으로 시작하여 세부 사항을 처리하고 기본 아이디어를 고정한 다음 실제 구성으로 넘어 갑시다.

  1. 하자 이미지 될 :가이 의미 되는 . 설정 함수 을 의 표시 . 즉, 및 경우 때 입니다.xXωxΩX(ωx)=xP:S[0,1]ωxP(A)=0ωxAP(A)=1ωxA

    이후 , 분명히 만족하는 확률의 처음 두 공리 . 그것이 세 번째를 만족한다는 것을 보여줄 필요가있다. 즉, 그것은 시그마 첨가제입니다. 그러나 이것은 명백한 거의입니다 : 때마다 상호 배타적 이벤트의 유한 또는 countably 무한 집합입니다, 다음 둘 중 하나 하나도 포함하지 .. 이대로 경우 모든 대해 또는 정확히 하나에 가 포함 ,이 경우 특정 대해 이고 그렇지 않으면 모든 위해P(Ω)=1P{Ei,i=1,2,}ωxP(Ei)=0iωxP(Ej)=1jP(Ei)=0ij. 두 경우 모두

    P(iEi)=iP(Ei)

    양변이 모두 또는 모두 이기 때문 입니다.01

    이후 모든 확률을 집중 의 분포 집중되고 및 영 분산을 가져야한다.PωxXxX

  2. 하자 의 범위에있는 두 개의 값이 될 ; 즉, 및 입니다. 이전 단계와 유사한 방식으로 측정 값 를 및 의 지표의 가중 평균으로 . 를 결정 하려면 음이 아닌 가중치 및 를 사용하십시오. 이전과 마찬가지로 (1)에서 설명한 지표 측정 값의 볼록한 조합 인 는 확률 측정 값입니다. 이 측정에 대한 의 분포 는 Bernoullix1x2XX(ω1)=x1X(ω2)=x2Pω1ω21pppPX(p) 의해 조정 되고 의해 이동 된 . Bernoulli 분포의 분산이 이므로 의 분산은 이어야합니다 .x2x1x1(p)p(1p)X(x2x1)2p(1p)

(2)의 직접적인 결과는이다 되는 존재 의 범위에서 및 하는rx1x2X0p<1

r=(x2x1)2p(1p)

의 분산 일 수 있습니다 . 이후 , 이것이 의미X0p(1p)1/4

2r=4rrp(1p)=(x2x1)2=x2x1sup(X)inf(X),

에 최대 값과 최소값이있는 경우에만 동등하게 유지됩니다 .X

반대로, 이 의이 범위를 초과하는 경우 , 우리는 이미 임의의 경계 변수의 분산이 4 분의 1을 초과 할 수 없다는 것을 알고 있기 때문에 해결책이 없습니다. 범위의 제곱.r(sup(X)inf(X))2/4


3
야, 난 당신이 OP와 완전히 다른 수준에 있다고 생각합니다.
Mark L. Stone

4
@ 마크 아마. (여기서 매우 건조한 유머를 발견했다고 생각합니다.) 수학 통계 태그를 자신의 게시물에 적용하는 사람은 이런 종류의 것들을 기대해야합니다 :-).
whuber

2
사무엘 칼린 교수 (칼린과 테일러의 명성)에서 "총 양성"에 대해 4 명의 학생 수업을 들었을 때를 생각 나게합니다. 게임 이론의 주제가 어떻게 든 나타났습니다. 그는 게임 이론을 말했다. 음이 아닌 시그마 유한 측정 값이 두 개 있습니다 .... 이제 교양 대학의 신입생 경제 수업 학생들에게 게임 이론을 이런 방식으로 소개한다고 상상해보십시오. 그것이 귀하의 게시물이 생각한 것입니다.
Mark L. Stone

@Mark Understood. 그렇게하지 않고 성공할 것입니다. 당신이 지적했듯이, 나는 여기에 특정 독자가 아닌 일반 독자를 위해 글을 쓰고 있습니다. 다른 한편으로, 추상적 주제는 (이 초급 수준에서) 어렵지 않으며 교양 대학의 동기 부여가 될 수있는 것으로 밝혀졌습니다. 예를 들어 stats.stackexchange.com/a/94876 의 주석을 참조하십시오 .
whuber

4
@ MarkL.Stone 답변은 즉각적인 질문 이상의 의미를 지니고 있으며 (SE는 유사한 질문을 가진 후기 사람들에게 유용한 좋은 질문과 좋은 답변의 저장소가되어야합니다.) . 일부 다른 독자들은 초등 적으로 취한 것에서 무언가를 얻을 수 있으므로 다양한 스타일과 수준의 답변이 더 많은 사람들에게 질문을 유용하게 만듭니다.
Glen_b-복지 모니카

10

예, 그러한 분포를 찾을 수 있습니다. 사실 당신이 취할 수 유한 분산 어떤 유통 , 당신의 상태에 맞게, 그리고 규모 때문에

Var[cX]=c2Var[X]

예를 들어, 구간 의 균일 분포 는 분산이 있습니다 : 따라서 간격의 균일 분포 는 분산 입니다.[0,1]

σ2=112
[0,112r]r

실제로 이것은 Student t와 같은 일부 분포에 모수를 추가하는 일반적인 방법입니다. 여기에는 하나의 매개 변수 인 자유도가 있습니다. 때 표준 정상 분포에 수렴. 종 모양이며 보통과 비슷하지만 꼬리가 더 굵습니다. 그것이 꼬리가 뚱뚱 할 때 정규 분포의 대안으로 종종 사용되는 이유입니다. 유일한 문제는 가우스 분포에 두 개의 매개 변수가 있다는 것입니다. 따라서, " t 위치 스케일"분포 라고도하는 Student t의 스케일 버전이 제공됩니다 . 이것은 매우 간단한 변환입니다 : 여기서 는 위치와 스케일입니다. 이제 새 변수 되도록 축척을 설정할 수 있습니다ννξ=tμsμ,sξ 필요한 분산이 있으며 Student t 분포의 모양을 갖습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.