모든 변수가 정량적 인 3 개의 변수가있는 데이터 세트가 있습니다. 그것을 , 및 라고합시다 . MCMC를 통해 베이지안 관점에서 회귀 모델을rjags
탐색 적 분석을 수행했으며 의 산점도 는 2 차 항을 사용해야한다고 제안합니다. 그런 다음 두 가지 모델을 장착했습니다
(1)
(2)
모델 1에서 각 매개 변수의 효과 크기는 작지 않으며 95 % 신뢰할 수있는 간격은 0 값을 포함하지 않습니다 .
모델 2에서 매개 변수 및 \ beta_4 의 효과 크기 는 작고 모든 매개 변수에 대한 각 신뢰할 수있는 간격에는 0이 포함 됩니다.
신뢰할 수있는 간격에 이 포함되어 있다는 사실 만으로도 매개 변수가 중요하지 않다고 말할 수 있습니까?
그런 다음 다음 모델을 조정했습니다.
(3)
각 매개 변수의 효과 크기는 작지 않지만 \ beta_1 을 제외하고 모든 신뢰할 수있는 간격에는 0이 포함 됩니다.
베이지안 통계에서 변수 선택을 수행하는 올바른 방법은 무엇입니까?
편집 : 베타 모델과 같은 회귀 모델에서 올가미를 사용할 수 있습니까? 여기서 는 벡터 인 가변 분산 모델을 사용하고 있습니다 . 이전에 Laplace도 사용해야 합니까?
EDIT2 : 대한 Gaussian priori , 및 Laplace (double-exponential) 모델이 있습니다.
가우스 모형의 추정치는 다음과 같습니다.
Mean SD Naive SE Time-series SE
B[1] -1.17767 0.07112 0.0007497 0.0007498
B[2] -0.15624 0.03916 0.0004128 0.0004249
B[3] 0.15600 0.05500 0.0005797 0.0005889
B[4] 0.07682 0.04720 0.0004975 0.0005209
delta[1] -3.42286 0.32934 0.0034715 0.0034712
delta[2] 0.06329 0.27480 0.0028966 0.0028969
delta[3] 1.06856 0.34547 0.0036416 0.0036202
delta[4] -0.32392 0.26944 0.0028401 0.0028138
올가미 모델의 추정치는 다음과 같습니다.
Mean SD Naive SE Time-series SE
B[1] -1.143644 0.07040 0.0007421 0.0007422
B[2] -0.160541 0.05341 0.0005630 0.0005631
B[3] 0.137026 0.05642 0.0005947 0.0005897
B[4] 0.046538 0.04770 0.0005028 0.0005134
delta[1] -3.569151 0.27840 0.0029346 0.0029575
delta[2] -0.004544 0.15920 0.0016781 0.0016786
delta[3] 0.411220 0.33422 0.0035230 0.0035629
delta[4] -0.034870 0.16225 0.0017103 0.0017103
lambda 7.269359 5.45714 0.0575233 0.0592808
올가미 모델에서는 및 대한 추정치 가 많이 줄었습니다. 모델에서이 변수를 제거해야합니까?
EDIT3 : Double Exponential Prior (Lasso) 모델은 Gaussian priors 모델보다 Deviance, BIC 및 DIC 값이 더 Gaussian 모델에서 분산 계수 를 제거한 후 더 작은 값을 얻습니다 .