아마도 직접적인 연결이 없습니까? 의 분포 대부분의 시뮬레이션에 따라 X . 당신이 시뮬레이션 경우 X를 함께 N ( 0 , 1 ) , EXP ( - X β ) 으로해야합니다 로그 정규 분포 μ = - 1 주어진 β 0 = β 1 = 1 . P 의 분포 ( A = 1 | XP(A=1|X)XXN(0,1)exp(−Xβ)μ=−1β0=β1=1 는 다음과 같이 명시 적으로 찾을 수 있습니다. cdf F ( x ) = 1 − Φ [ ln ( 1P(A=1|X)역 cdfQ(x)=1
F(x)=1−Φ[ln(1x−1)+1],
및 PDF
F(X)=1Q(x)=11+exp(Φ−1(1−x)−1),
베타 배포판과 유사하지 않습니다.
f(x)=1x(1−x)2π−−√exp(−(ln(1/x−1)+1)22),
R 에서 위의 결과를 확인할 수 있습니다 .
n = 100000
X = cbind(rep(1, n), rnorm(n)) # simulate design matrix
Y = 1 / (exp(-X %*% c(1,1)) + 1) # P(A=1|X)
Z1 = 1 / (rlnorm(n, -1, 1) + 1) # simulate from lognormal directly
Z2 = 1 / (1 + exp(qnorm(runif(n)) - 1)) # simulate with inverse CDF
# Kolmogorov–Smirnov test
ks.test(Y, Z1)
ks.test(Y, Z2)
# plot fitted density
new.pdf = function(x) {
1 / (x * (1 - x) * sqrt(2 * pi)) * exp(-0.5 * (log(1 / x - 1) + 1)^2)
}
hist(Y, breaks = "FD", probability = T)
curve(new.pdf, col = 4, add = T)