나는 좋은 블로그 게시물 과 그 안에 연결된 논문에 따라 일부 베이지안 변수 선택을 가지고 장난감을 가지고 있다고 생각했습니다 . rjags (내가 꽤 신인 임) 에서 프로그램 을 작성하고 Exxon Mobil에 대한 가격 데이터 를 가져 왔으며 , 수익률 (예 : 팔라듐 가격)을 설명 할 수없는 것 및 SP500과 같이 관련성이 높은 다른 것 ).
실행 lm()
, 우리는 거기에 강력한 overparameterized 모델의 증거,하지만 팔라듐 확실히 제외되어야 것을 볼 수 :
Call:
lm(formula = Exxon ~ 0 + SP + Palladium + Russell + OilETF +
EnergyStks, data = chkr)
Residuals:
Min 1Q Median 3Q Max
-1.663e-03 -4.419e-04 3.099e-05 3.991e-04 1.677e-03
Coefficients:
Estimate Std. Error t value Pr(>|t|)
SP 0.51913 0.19772 2.626 0.010588 *
Palladium 0.01620 0.03744 0.433 0.666469
Russell -0.34577 0.09946 -3.476 0.000871 ***
OilETF -0.17327 0.08285 -2.091 0.040082 *
EnergyStks 0.79219 0.11418 6.938 1.53e-09 ***
반환으로 변환 한 후 다음과 같은 간단한 모델을 실행하려고했습니다.
model {
for (i in 1:n) {
mean[i]<-inprod(X[i,],beta)
y[i]~dnorm(mean[i],tau)
}
for (j in 1:p) {
indicator[j]~dbern(probindicator)
betaifincluded[j]~dnorm(0,taubeta)
beta[j] <- indicator[j]*betaifincluded[j]
}
tau~dgamma(1,0.01)
taubeta~dgamma(1,0.01)
probindicator~dbeta(2,8)
}
그러나 선택한 감마 분포에 대한 매개 변수에 관계없이 각 변수에 대해 변하지 않는 20 %의 포함 확률과 같은 무의미한 답변을 얻었습니다.
나는 또한 작고 작은 회귀 계수를 얻었습니다.이 모델은 선택 모델이어야한다고 생각한 후에 용납 할 수 있지만 여전히 이상하게 보입니다.
Mean SD Naive SE Time-series SE
SP beta[1] -4.484e-03 0.10999 0.003478 0.007273
Palladium beta[2] 1.422e-02 0.16646 0.005264 0.011106
Russell beta[3] -2.406e-03 0.08440 0.002669 0.003236
OilETF beta[4] -4.539e-03 0.14706 0.004651 0.005430
EnergyStks beta[5] -1.106e-03 0.07907 0.002500 0.002647
SP indicator[1] 1.980e-01 0.39869 0.012608 0.014786
Palladium indicator[2] 1.960e-01 0.39717 0.012560 0.014550
Russell indicator[3] 1.830e-01 0.38686 0.012234 0.013398
OilETF indicator[4] 1.930e-01 0.39485 0.012486 0.013229
EnergyStks indicator[5] 2.070e-01 0.40536 0.012819 0.014505
probindicator 1.952e-01 0.11981 0.003789 0.005625
tau 3.845e+03 632.18562 19.991465 19.991465
taubeta 1.119e+02 107.34143 3.394434 7.926577
베이지안 변수 선택이 그렇게 나쁘거나 민감합니까? 아니면 눈부신 오류가 있습니까?