하자 및 2 iidrv의 수 곳 . 의 분포를 알고 싶습니다 .X 2 로그 ( X 1 ) , 로그 ( X 2 ) ~ N ( μ , σ ) X 1 - X 2
내가 할 수있는 최선의 방법은 테일러 시리즈를 모두 가져 와서 차이가 나머지 항 사이의 나머지 차이와 함께 두 정규 rv와 두 카이 제곱 rv의 차이의 합이라는 것을 얻는 것입니다. 2 iid log-normal rv의 차이 분포를 얻는 더 직접적인 방법이 있습니까?
하자 및 2 iidrv의 수 곳 . 의 분포를 알고 싶습니다 .X 2 로그 ( X 1 ) , 로그 ( X 2 ) ~ N ( μ , σ ) X 1 - X 2
내가 할 수있는 최선의 방법은 테일러 시리즈를 모두 가져 와서 차이가 나머지 항 사이의 나머지 차이와 함께 두 정규 rv와 두 카이 제곱 rv의 차이의 합이라는 것을 얻는 것입니다. 2 iid log-normal rv의 차이 분포를 얻는 더 직접적인 방법이 있습니까?
답변:
이것은 어려운 문제입니다. 나는 로그 정규 분포의 모멘트 생성 기능을 사용하는 것에 대해 먼저 생각했습니다. 내가 설명하는 것처럼 작동하지 않습니다. 그러나 먼저 몇 가지 표기법이 있습니다.
하자 표준 정규 밀도 될 Φ 대응하는 누적 분포 함수. 밀도 함수 f ( x ) = 1 인 대수 정규 분포 l n N ( 0 , 1 ) 만 분석합니다. 및 누적 분포 함수 F(x)=Φ(lnx)X와Y가 위의 로그 정규 분포를 갖는 독립적 인 랜덤 변수 라고 가정합니다. 우리는평균이 0 인 대칭 분포인D=X-Y의 분포에 관심이있습니다. 하자M(t)=는EEtX될 순간 발생 기능X를. t에대해서만 정의됩니다
This expression can be used for numerical integration or as a basis for simulation. First a test:
integrate(function(y) plnorm(y)*dlnorm(y), lower=0, upper=+Inf)
0.5 with absolute error < 2.3e-06
which is clearly correct. Let us wrap this up inside a function:
pDIFF <- function(t) {
d <- t
for (tt in seq(along=t)) {
if (t[tt] >= 0.0) d[tt] <- integrate(function(y) plnorm(y+t[tt])*dlnorm(y),
lower=0.0, upper=+Inf)$value else
d[tt] <- 1-integrate(function(y) plnorm(y+abs(t[tt]))*dlnorm(y),
lower=0.0, upper=+Inf)$value
}
return(d)
}
> plot(pDIFF, from=-5, to=5)
which gives:
Then we can find the density function by differentiating under the integral sign, obtaining
dDIFF <- function(t) {
d <- t; t<- abs(t)
for (tt in seq(along=t)) {
d[tt] <- integrate(function(y) dlnorm(y+t[tt])*dlnorm(y),
lower=0.0, upper=+Inf)$value
}
return(d)
}
which we can test:
> integrate(dDIFF, lower=-Inf, upper=+Inf)
0.9999999 with absolute error < 1.3e-05
And plotting the density we get:
plot(dDIFF, from=-5, to=5)
I did also try to get some analytic approximation, but so far didn't succeed, it is not an easy problem. But numerical integration as above, programmed in R is very fast on modern hardware, so is a good alternative which probably should be used much more.
This does not strictly answer your question, but wouldn't it be easier to look at the ratio of the and ? You then simply arrive at
Depending on your application, this may serve your needs.