배경과 경험적 예
두 가지 연구가 있습니다. 실험 (연구 1)을 실행 한 다음 실험 (연구 2)을 수행했습니다. 연구 1에서 두 변수 사이의 상호 작용을 발견했습니다. 연구 2에서,이 상호 작용은 같은 방향이지만 유의하지는 않았습니다. 연구 1의 모델에 대한 요약은 다음과 같습니다.
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.75882 0.26368 21.840 < 2e-16 ***
condSuppression -1.69598 0.34549 -4.909 1.94e-06 ***
prej -0.01981 0.08474 -0.234 0.81542
condSuppression:prej 0.36342 0.11513 3.157 0.00185 **
그리고 Study 2의 모델 :
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.24493 0.24459 21.444 <2e-16 ***
prej 0.13817 0.07984 1.731 0.0851 .
condSuppression -0.59510 0.34168 -1.742 0.0831 .
prej:condSuppression 0.13588 0.11889 1.143 0.2545
"복제에 실패했기 때문에 아무 것도 없다고 생각합니다."라고 말하는 대신 두 데이터 세트를 결합하고 데이터의 연구에 대한 더미 변수를 만든 다음 상호 작용을 실행했습니다. 연구 더미 변수를 제어 한 후 다시. 이 상호 작용은 그것을 제어 한 후에도 중요했으며 조건과 싫어요 / prej 간의이 양방향 상호 작용은 연구 더미 변수와의 3 방향 상호 작용에 의해 자격이 없다는 것을 알았습니다.
베이지안 분석 소개
나는 이것이 베이지안 분석을 사용할 수있는 좋은 기회라고 제안했다. 연구 2에서, 연구 1의 정보는 사전 정보로 사용할 수있다! 이런 식으로, 연구 2는 연구 1의 잦은 평범한 최소 제곱 결과로부터 베이지안 업데이트를 수행하고 있습니다. 따라서, 이제 계수에 대한 정보적인 우선 순위를 사용하여 연구 2 모델로 돌아가서 다시 분석합니다. 모든 계수에는 평균이 스터디 1의 추정치이고 표준 편차가 스터디 1의 표준 오차 인 경우의 정규.
결과는 다음과 같습니다.
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.63 0.17 5.30 5.52 5.63 5.74 5.96
condSuppression -1.20 0.20 -1.60 -1.34 -1.21 -1.07 -0.80
prej 0.02 0.05 -0.08 -0.01 0.02 0.05 0.11
condSuppression:prej 0.34 0.06 0.21 0.30 0.34 0.38 0.46
sigma 1.14 0.06 1.03 1.10 1.13 1.17 1.26
mean_PPD 5.49 0.11 5.27 5.41 5.49 5.56 5.72
log-posterior -316.40 1.63 -320.25 -317.25 -316.03 -315.23 -314.29
연구 2 분석의 상호 작용에 대한 확실한 증거가 생겼습니다. 이것은 단순히 서로의 위에 데이터를 쌓고 더미 변수로 연구 번호로 모델을 실행할 때 내가 한 일에 동의합니다.
반증 : 먼저 2 번 공부를하면 어떻게 되나요?
연구 2를 먼저 실행 한 다음 연구 1의 데이터를 사용하여 연구 2에 대한 신념을 업데이트하면 어떻게 될까요? 위와 동일한 작업을 수행했지만 그 반대의 경우도있었습니다. 연구 1 데이터를 분석하기위한 사전 평균 및 표준 편차로 연구 2의 잦은 일반 최소 제곱 계수 추정치 및 표준 편차를 사용하여 연구 1 데이터를 다시 분석했습니다. 요약 결과는 다음과 같습니다.
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.35 0.17 5.01 5.23 5.35 5.46 5.69
condSuppression -1.09 0.20 -1.47 -1.22 -1.09 -0.96 -0.69
prej 0.11 0.05 0.01 0.08 0.11 0.14 0.21
condSuppression:prej 0.17 0.06 0.05 0.13 0.17 0.21 0.28
sigma 1.10 0.06 0.99 1.06 1.09 1.13 1.21
mean_PPD 5.33 0.11 5.11 5.25 5.33 5.40 5.54
log-posterior -303.89 1.61 -307.96 -304.67 -303.53 -302.74 -301.83
다시, 우리는 상호 작용에 대한 증거를 보지만, 반드시 그런 것은 아닙니다. 두 베이지안 분석 모두에 대한 포인트 추정치가 서로 95 % 신뢰할 수있는 간격을 유지하지는 않습니다. 베이지안 분석에서 두 개의 신뢰할 수있는 간격은 겹치는 것보다 겹치지 않습니다.
시간 우선 순위에 대한 베이지안 칭의는 무엇입니까?
따라서 제 질문은 : 베이지안이 데이터를 수집하고 분석하는 방법의 연대기를 존중하는 데 어떤 정당화가 있습니까? 나는 연구 1에서 결과를 얻고 연구 2에서 유익한 선행으로 사용하여 연구 2를 사용하여 나의 신념을 "업데이트"합니다. 그러나 우리가 얻는 결과가 진정한 모집단 효과를 가진 분포에서 무작위로 가져 온다고 가정하면 왜 연구 1의 결과에 특권을 부여합니까? 연구 1의 결과로서 연구 2 결과를 취하는 대신 연구 2의 결과로서 연구 1 결과를 이용하는 것에 대한 정당성은 무엇인가? 분석을 수집하고 계산 한 순서가 실제로 중요합니까? 나에게 꼭 필요한 것 같지 않습니다. 이것에 대한 베이지안의 정당성은 무엇입니까? 왜 연구 1을 먼저 실행했기 때문에 포인트 추정치가 .17보다 .34에 가깝다고 생각해야합니까?
Kodiologist의 답변에 응답
Kodiologist는 다음과 같이 말했습니다.
두 번째는 베이지안 컨벤션에서 출발 한 중요한 출발점입니다. 사전을 먼저 설정 한 다음 베이지안 방식으로 두 모델을 모두 맞추십시오. 바이에른이 아닌 방식으로 한 모델을 적합시킨 다음 다른 모델에 대해 이전 모델에 사용했습니다. 기존의 접근 방식을 사용했다면 여기서 본 순서에 의존하지 않습니다.
이 문제를 해결하기 위해 모든 회귀 계수가 이전 인 연구 1 및 연구 2의 모형에 적합합니다 . 변수는 0 또는 1을 부호화 실험 조건에 대한 더미 변수였다 변수뿐만 아니라, 결과는 모두 따라서, 나는 그것이 이전의 공정한 선택 생각 1에서 7까지 7 점 척도로 측정되었다. 데이터의 스케일링 방식만으로도 이전에 제안한 것보다 훨씬 큰 계수를 보는 것은 매우 드,니다.cond
prej
이러한 추정치의 평균 추정치 및 표준 편차는 OLS 회귀 분석과 거의 같습니다. 연구 1 :
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.756 0.270 5.236 5.573 5.751 5.940 6.289
condSuppression -1.694 0.357 -2.403 -1.925 -1.688 -1.452 -0.986
prej -0.019 0.087 -0.191 -0.079 -0.017 0.040 0.150
condSuppression:prej 0.363 0.119 0.132 0.282 0.360 0.442 0.601
sigma 1.091 0.057 0.987 1.054 1.088 1.126 1.213
mean_PPD 5.332 0.108 5.121 5.259 5.332 5.406 5.542
log-posterior -304.764 1.589 -308.532 -305.551 -304.463 -303.595 -302.625
그리고 연구 2 :
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.249 0.243 4.783 5.082 5.246 5.417 5.715
condSuppression -0.599 0.342 -1.272 -0.823 -0.599 -0.374 0.098
prej 0.137 0.079 -0.021 0.084 0.138 0.192 0.287
condSuppression:prej 0.135 0.120 -0.099 0.055 0.136 0.214 0.366
sigma 1.132 0.056 1.034 1.092 1.128 1.169 1.253
mean_PPD 5.470 0.114 5.248 5.392 5.471 5.548 5.687
log-posterior -316.699 1.583 -320.626 -317.454 -316.342 -315.561 -314.651
이러한 평균과 표준 편차는 OLS 추정치와 거의 동일하기 때문에 위의 차수 효과가 여전히 발생합니다. 연구 2를 분석 할 때 연구 1의 사후 요약 통계를 사전에 플러그인하면 연구 2를 먼저 분석 한 후 사후 요약 통계를 연구 1을 분석하기위한 사전으로 사용할 때와 다른 최종 사후를 관찰합니다.
잦은 추정치 대신 이전과 같이 회귀 계수에 베이지안 평균과 표준 편차를 사용하더라도 여전히 동일한 차수 효과를 관찰 할 수 있습니다. 따라서 문제는 여전히 남아 있습니다. 처음에 나온 연구를 특권으로하는 베이지안의 정당성은 무엇입니까?
rstanarm
또는 Stan 으로 포함시키는 방법이 있습니까? 그 질문 전에 여기에 요청 된 것 같다 : stats.stackexchange.com/questions/241690/...
prej
절차를 오해하지 않는 한 어느 쪽이든 동일해야합니다.