주어진 상수 (예 : 4)에 대해 에 대한 확률 분포를 찾을 수 있으므로 ?
주어진 상수 (예 : 4)에 대해 에 대한 확률 분포를 찾을 수 있으므로 ?
답변:
의 경우를주의 깊게 고려하십시오 . 이면 분포가 퇴화되지만 는 평균을 가질 수 있습니다. 즉, 대해 및 입니다 . 따라서 에 대해 가능한 많은 분포를 찾을 수 있지만 의해 색인화되고 완전히 지정됩니다 .
경우 어떠한 분포 때문에, 발견되지 .
들어 , 대답은 추가 정보가에 대해 알려진에 따라 달라집니다 . 예를 들어, 가 평균 인 것으로 알려진 경우 , 및 대해 을 취함으로써 이러한 모멘트를 갖는 분포를 찾을 수 있습니다 . 이것은 평균과 분산을 일치시키는 문제에 대한 유일한 해결책은 아니지만, 정규 분포가 유일하게 분산 된 솔루션입니다 (그리고 가능한 모든 솔루션 중에서 이것은 Daniel이 지적한 것처럼 엔트로피를 최대화하는 솔루션입니다). 예를 들어 세 번째 중심 모멘트 이상 을 일치 시키려면 더 넓은 범위의 확률 분포를 고려해야합니다.
대신 의 순간보다는 의 분포에 대한 정보가 있다고 가정하십시오 . 예를 들어, 가 Poisson 분포를 따른다는 것을 알고 있다면 고유 한 솔루션은 입니다. 가 지수 분포를 따른다는 것을 알고 있다면 , 고유 한 솔루션 . 여기서 을 해결하여 모수를 찾았습니다 .
다른 경우에는 전체 솔루션 제품군을 찾을 수 있습니다. 가 직사각형 (연속 균일 분포) 분포를 따른다는 것을 알면 를 풀어 분포 의 고유 너비 를 찾을 수 있습니다 . 그러나 의해 매개 변수화 된 의 전체 솔루션 계열이있을 것 입니다.이 세트의 분포는 모두 서로의 번역입니다. 마찬가지로 가 정규이면 모든 분포 이 작동합니다 (따라서 우리는 색인 된 전체 솔루션 세트를 갖습니다 . 이는 다시 임의의 실수가 될 수 있으며 패밀리는 모두 번역입니다) 서로의). 만약 다음 감마 분포 형상 스케일 파라미터를 사용하고, 우리는 솔루션의 가족을 얻을 수 있고, 에서 parametized . 이 가족의 구성원은 서로의 번역이 아닙니다. "솔루션 계열"이 어떻게 보이는지 시각화하기 위해 색인화 된 정규 분포의 예 와 색인화 된 감마 분포 ( 예 : 의 예 : 에 해당) 당신의 질문.
반면에 일부 분포의 경우 값에 따라 해를 찾는 것이 가능하지 않을 수도 있습니다 . 예를 들어 만약 에 대해 다음 베르누이 변수이어야 두 가지 해결책이 존재 개의 확률이 있기 때문에 방정식을 해결 이고 실제로이 두 확률은 상보 적입니다. 즉 입니다. 들면 에만 고유 용액가 , 및 대한 더 베르누이 분포는 충분히 높은 변화가 없다.
나는 케이스를 언급해야한다고 생각합니다 . 이 경우에 대한 해법도 있습니다 (예 : 자유도가 2 인 스튜던트 분포) .
플롯의 R 코드
require(ggplot2)
x.df <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")
x.df <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
coord_cartesian(ylim = c(0, 1))
뜻 가정하면 "것이 가능 찾는 것입니다 확률 분포 에 대한 당신이 것을 어떤 기준을 지정하지 않은 것처럼"그 대답은 '예' 만족해야합니다. 실제로이 조건을 만족시킬 수있는 무한한 분포가 있습니다. 정규 분포 . 당신은 설정할 수 있습니다 하고 처럼 어떤 값을 취할 수 - 당신이 다음 것이다 필요에 따라.
실제로, 정규 분포는 주어진 평균과 분산에 대한 최대 엔트로피 확률 분포 이므로 이와 관련하여 다소 특별 합니다.
이 질문은 흥미롭고 완전히 사소한 것이 아닌 방식으로 해석 될 수 있습니다. 임의의 변수처럼 보이는 가 주어지면 , 분산이 미리 지정된 수 과 같은 방식으로 확률을 값에 할당하거나 기존 확률을 주변으로 이동시킬 수 있습니까? 대답은 가능한 모든 값 이 허용되며 최대 범위는 범위에 의해 결정됩니다 .
이러한 분석에 대한 잠재적 관심은 특정 목표를 달성하기 위해 확률 변수를 변경하고 임의 변수를 고정 된 상태로 유지하는 아이디어에 있습니다. 이 응용 프로그램은 간단하지만 수학 재무의 기본 결과 인 Girsanov 정리의 기본 아이디어를 표시합니다 .
이 질문을 엄격하고 모호하지 않은 방식으로 다시 설명하겠습니다. 가정
sigma-algebra 로 측정 공간 에 정의 된 측정 가능한 함수 입니다. 주어진 실수 , 이 공간에서 확률 측정 를 언제 찾을 수 있습니까?
대답은 때 가능하다는 것 입니다. (최고와 부정이 모두 달성되면 평등을 유지할 수 있습니다. 즉, 실제로 의 최대 값과 최소값입니다 .) 또는 인 경우이 조건 제한을 두지 않으면 음수가 아닌 모든 분산 값이 가능합니다.
증거는 건설에 의한 것입니다. 간단한 버전으로 시작하여 세부 사항을 처리하고 기본 아이디어를 고정한 다음 실제 구성으로 넘어 갑시다.
하자 이미지 될 :가이 의미 되는 . 설정 함수 을 의 표시 . 즉, 및 경우 때 입니다.
이후 , 분명히 만족하는 확률의 처음 두 공리 . 그것이 세 번째를 만족한다는 것을 보여줄 필요가있다. 즉, 그것은 시그마 첨가제입니다. 그러나 이것은 명백한 거의입니다 : 때마다 상호 배타적 이벤트의 유한 또는 countably 무한 집합입니다, 다음 둘 중 하나 하나도 포함하지 .. 이대로 경우 모든 대해 또는 정확히 하나에 가 포함 ,이 경우 특정 대해 이고 그렇지 않으면 모든 위해. 두 경우 모두
양변이 모두 또는 모두 이기 때문 입니다.
이후 모든 확률을 집중 의 분포 집중되고 및 영 분산을 가져야한다.
하자 의 범위에있는 두 개의 값이 될 ; 즉, 및 입니다. 이전 단계와 유사한 방식으로 측정 값 를 및 의 지표의 가중 평균으로 . 를 결정 하려면 음이 아닌 가중치 및 를 사용하십시오. 이전과 마찬가지로 (1)에서 설명한 지표 측정 값의 볼록한 조합 인 는 확률 측정 값입니다. 이 측정에 대한 의 분포 는 Bernoulli 의해 조정 되고 의해 이동 된 . Bernoulli 분포의 분산이 이므로 의 분산은 이어야합니다 .
(2)의 직접적인 결과는이다 되는 존재 의 범위에서 및 하는
의 분산 일 수 있습니다 . 이후 , 이것이 의미
에 최대 값과 최소값이있는 경우에만 동등하게 유지됩니다 .
반대로, 이 의이 범위를 초과하는 경우 , 우리는 이미 임의의 경계 변수의 분산이 4 분의 1을 초과 할 수 없다는 것을 알고 있기 때문에 해결책이 없습니다. 범위의 제곱.
예, 그러한 분포를 찾을 수 있습니다. 사실 당신이 취할 수 유한 분산 어떤 유통 , 당신의 상태에 맞게, 그리고 규모 때문에
예를 들어, 구간 의 균일 분포 는 분산이 있습니다 : 따라서 간격의 균일 분포 는 분산 입니다.
실제로 이것은 Student t와 같은 일부 분포에 모수를 추가하는 일반적인 방법입니다. 여기에는 하나의 매개 변수 인 자유도가 있습니다. 때 표준 정상 분포에 수렴. 종 모양이며 보통과 비슷하지만 꼬리가 더 굵습니다. 그것이 꼬리가 뚱뚱 할 때 정규 분포의 대안으로 종종 사용되는 이유입니다. 유일한 문제는 가우스 분포에 두 개의 매개 변수가 있다는 것입니다. 따라서, " t 위치 스케일"분포 라고도하는 Student t의 스케일 버전이 제공됩니다 . 이것은 매우 간단한 변환입니다 : 여기서 는 위치와 스케일입니다. 이제 새 변수 되도록 축척을 설정할 수 있습니다 필요한 분산이 있으며 Student t 분포의 모양을 갖습니다.