이것은 베이지안 추론을 사용하여 쉽게 해결해야합니다. 실제 값과 관련하여 개별 포인트의 측정 속성을 알고 있으며 실제 값을 생성 한 모집단 평균 및 SD를 추론하려고합니다. 이것은 계층 적 모델입니다.
문제의 표현 (Bayes basics)
정통 통계는 단일 평균을 제공하지만 베이지안 프레임 워크에서는 신뢰할 수있는 평균 값의 분포를 얻습니다. 예를 들어, SD (2, 2, 3)에 대한 관측치 (1, 2, 3)는 최대 우도 추정치 2에 의해 생성 될 수 있었지만 평균 2.1 또는 1.8에 의해 생성되었을 수 있습니다. MLE. 따라서 SD 외에도 평균도 추론합니다 .
또 다른 개념적 차이점은 관찰하기 전에 지식 상태 를 정의해야한다는 것 입니다. 우리는 이것을 우선 순위 라고 부릅니다 . 특정 영역이 스캔되었고 특정 높이 범위에 있음을 미리 알고있을 것입니다. 지식의 완전한 부재는 X와 Y에서 이전과 같이 균일 한 (-90, 90)도를 가질 것이며, 아마도 높이가 바다 (지상에서 가장 높은 지점 아래)에서 균일 한 (0, 10000) 미터 일 것이다. 추정하려는 모든 모수 에 대해 사전 분포 를 정의해야합니다 . 즉, 사후 분포 를 구해야 합니다. 표준 편차에 대해서도 마찬가지입니다.
따라서 문제를 표현하면 세 가지 평균 (X.mean, Y.mean, X.mean)과 세 가지 표준 편차 (X.sd, Y.sd, X.sd)에 대해 신뢰할 수있는 값을 추론하고 싶다고 가정합니다. 데이터를 생성했습니다.
모델
표준 BUGS 구문 (WinBUGS, OpenBUGS, JAGS, stan 또는 기타 패키지를 사용하여이를 실행)을 사용하면 모델은 다음과 같습니다.
model {
# Set priors on population parameters
X.mean ~ dunif(-90, 90)
Y.mean ~ dunif(-90, 90)
Z.mean ~ dunif(0, 10000)
X.sd ~ dunif(0, 10) # use something with better properties, i.e. Jeffreys prior.
Y.sd ~ dunif(0, 10)
Z.sd ~ dunif(0, 100)
# Loop through data (or: set up plates)
# assuming observed(x, sd(x), y, sd(y) z, sd(z)) = d[i, 1:6]
for(i in 1:n.obs) {
# The true value was generated from population parameters
X[i] ~ dnorm(X.mean, X.sd^-2) #^-2 converts from SD to precision
Y[i] ~ dnorm(Y.mean, Y.sd^-2)
Z[i] ~ dnorm(Z.mean, Z.sd^-2)
# The observation was generated from the true value and a known measurement error
d[i, 1] ~ dnorm(X[i], d[i, 2]^-2) #^-2 converts from SD to precision
d[i, 3] ~ dnorm(Y[i], d[i, 4]^-2)
d[i, 5] ~ dnorm(Z[i], d[i, 6]^-2)
}
}
당연히 .mean 및 .sd 매개 변수를 모니터하고 그 후부를 사용하여 추론합니다.
시뮬레이션
다음과 같은 데이터를 시뮬레이션했습니다.
# Simulate 500 data points
x = rnorm(500, -10, 5) # mean -10, sd 5
y = rnorm(500, 20, 5) # mean 20, sd 4
z = rnorm(500, 2000, 10) # mean 2000, sd 10
d = cbind(x, 0.1, y, 0.1, z, 3) # added constant measurement errors of 0.1 deg, 0.1 deg and 3 meters
n.obs = dim(d)[1]
그런 다음 500 번의 번 번 번인 후 JAGS를 사용하여 2000 회 반복 모델을 실행했습니다. X.sd의 결과는 다음과 같습니다.
파란색 범위는 95 % 가장 높은 사후 밀도 또는 신뢰할 수있는 구간을 나타냅니다 (데이터를 관찰 한 후 매개 변수가 있다고 생각하는 경우 정통 신뢰 구간이이를 제공하지 않음).
빨간색 세로선은 원시 데이터의 MLE 추정치입니다. 베이지안 추정에서 가장 가능성있는 모수는 또한 정통 통계에서 가장 가능성있는 (최대 가능성) 모수 인 경우가 일반적입니다. 그러나 당신은 후부의 꼭대기에 너무 신경 쓰지 않아야합니다. 평균 또는 중앙값을 단일 숫자로 끓이려면 더 좋습니다.
잘못된 통계 때문에가 아니라 데이터가 무작위로 생성 되었기 때문에 MLE / top은 5가 아닙니다.
제한
현재 몇 가지 결함이있는 간단한 모델입니다.
- -90과 90 도의 정체성을 다루지 않습니다. 그러나 추정 된 매개 변수의 극단적 인 값을 (-90, 90) 범위로 이동시키는 일부 중간 변수를 만들어서 수행 할 수 있습니다.
- X, Y 및 Z는 상관 관계가 있지만 현재는 독립적으로 모델링되었으며 데이터를 최대한 활용하려면이를 고려해야합니다. 측정 장치가 이동했는지 (X, Y 및 Z의 직렬 상관 관계 및 공동 분포로 많은 정보를 제공 할 것인지) 정지 상태 (독립성 양호)에 따라 다릅니다. 요청에 따라 답변을 확장하여 이에 접근 할 수 있습니다.
공간 베이지안 모델에 대해 내가 알지 못하는 많은 문헌이 있다는 것을 언급해야한다.