의료 청중의 신뢰할 수있는 간격을 요약하는 방법


21

스탠 및 프론트 엔드 패키지 rstanarm또는 brmsI와 같은 혼합 모델 이전과 나는 쉽게 베이지안 방식으로 데이터를 분석 할 수 있습니다 lme. Kruschke-Gelman-Wagenmakers 등이 저의 책상에 저술 한 대부분의 책과 기사를 가지고 있지만, 이것들은 베이지안의 Skylla와 의료 리뷰어의 Charybdis 사이에서 찢어진 의료 청중의 결과를 요약하는 방법을 알려주지 않습니다. "우리는 분산 된 것이 아니라 의미를 원한다").

예 : 위 주파수 (1 / min)는 세 그룹으로 측정됩니다. 건강한 통제가 참조입니다. 각 참가자에 대해 여러 가지 측정이 있으므로 잦은 다음과 같은 혼합 모델을 사용했습니다 lme.

summary(lme(freq_min~ group, random = ~1|study_id, data = mo))

약간 편집 된 결과 :

Fixed effects: freq_min ~ group 
                   Value Std.Error DF t-value p-value
(Intercept)        2.712    0.0804 70    33.7  0.0000
groupno_symptoms   0.353    0.1180 27     3.0  0.0058
groupwith_symptoms 0.195    0.1174 27     1.7  0.1086

간단히하기 위해 2 * std 오류를 95 % CI로 사용합니다.

빈번한 맥락에서 나는 이것을 다음과 같이 요약했을 것이다.

  • 통제 그룹에서 추정 빈도는 2.7 / 분이었다 (여기에 CI를 추가 할 수도 있지만 절대 CI와 차이 CI로 인한 혼동으로 인해 때때로이를 피할 수있다).
  • no_symptoms 그룹에서 빈도는 대조군보다 0.4 / min, CI (0.11 ~ 0.59) / min, p = 0.006 높았습니다.
  • with_symptoms 그룹에서 빈도는 대조군보다 0.2 / min, CI (-0.04 ~ 0.4) / min, p = 0.11 높았습니다.

이것은 의학 출판물에 허용되는 최대의 복잡성에 관한 것입니다. 검토자는 아마도 두 번째 경우에 "유의하지 않음"을 추가하도록 요청할 것입니다.

다음은 stan_lmer기본 사전과 동일 합니다.

freq_stan = stan_lmer(freq_min~ group + (1|study_id), data = mo)


           contrast lower_CredI frequency upper_CredI
        (Intercept)     2.58322     2.714       2.846
   groupno_symptoms     0.15579     0.346       0.535
 groupwith_symptoms    -0.00382     0.188       0.384

CredI는 신뢰할 수있는 간격의 90 %입니다 (90 %가 기본값으로 사용되는 이유는 rstanarm 비 네트 참조).

질문 :

  • 위의 요약을 베이지안 세계로 번역하는 방법?
  • 사전 논의는 어느 정도까지 필요합니까? 나는 이전에 언급했을 때 논문이 일반적인 "주관적 가정"으로 되돌아 올 것이라고 확신한다. 또는 최소한 "기술적 인 논의가 필요하지 않습니다". 그러나 모든 베이지안 당국은 해석이 이전 상황에서만 유효하다고 요구합니다.
  • 베이지안 개념을 배신하지 않고 어떻게 공식적으로 "의의"대리자를 전달할 수 있습니까? "믿을 수 없을 정도로 다른"(uuuh ...) 또는 거의 믿을 수 없을 정도로 다른 (buoha ...)는 "중요한 의미에서"같은 소리가납니다.

조나 개 브리와 벤 굿 리치 (2016). rstanarm : Stan을 통한 베이지안 적용 회귀 모델링. R 패키지 버전 2.9.0-3. https://CRAN.R-project.org/package=rstanarm

스탠 개발팀 (2015). Stan : 확률 및 샘플링을위한 C ++ 라이브러리, 버전 2.8.0. URL http://mc-stan.org/ .

Paul-Christian Buerkner (2016). brms : Stan을 사용한 베이지안 회귀 모델 R 패키지 버전 0.8.0. https://CRAN.R-project.org/package=brms

Pinheiro J, Bates D, DebRoy S, Sarkar D 및 R Core Team (2016). nlme : 선형 및 비선형 혼합 효과 모델 . R 패키지 버전 3.1-124, http://CRAN.R-project.org/package=nlme>.


1
나는 의학 저널의 리뷰어 / 편집자에 대한 경험이 없지만 아마도 절편이 음일 확률은 0이고, "증상 없음"더미 변수의 계수가 음일 가능성은 0이며 약 5 % 확률이라고 말할 수 있습니다. "증상이있는"더미 변수의 계수가 음수입니다. 을 수행하여 약 5 % 더 정확하게 정량화 할 수 있습니다 mean(as.matrix(freq_stan)[,"groupwith_symptoms"] < 0).
벤 굿 리치

우리는 그것을 생각했고 5 %는 Ok를 들었다. 연구자들은 그것을 "의의"로 번역 할 것이지만, 일반적으로 의의를 오해하기 때문에 이중의 부정으로 옳을 것이다. 반면에 "제로 확률"은 살인자입니다. 아마도 <1 / Reff (p <0.001)는 근사치일까요? 그러나 다시 : p <xxx를 쓸 때, 나는 중요한 세계에 있습니다.
Dieter Menne

위의 n_eff로 Reff를 수정하십시오.
Dieter Menne

1
n_eff는 평균이 추정되는 정밀도와 관련되어 있기 때문에 개인적으로 테일 확률은 "n_eff 확률이 1 미만"이라고 언급하지 않습니다. 아마도 당신은 계수에 대한 1 개의 마이너스 드로우를 얻기에 충분히 긴 체인을 운영 할 수 group_nosymptoms있고 그것이 마이너스 일 가능성이 있다고 말할 수 1 / draws있습니다. 그러나 가로 채기 위해 체인은 이러한 데이터에 대해 부정적인 영역으로 방황하지 않을 것이므로 확률이 미만이라고 말할 수 1 / draws있습니다.
Ben Goodrich

stats.stackexchange.com/questions/148649/… 에서 도메인 전문가를위한 p- 값을 포함시키는 통계에 대한 좋은 조언을 얻었습니다 . p = 0
stijn

답변:


16

빠른 생각 :

1) 주요 문제는 통계 분석에서 원하는 정보를 결정하기 때문에 청중에게 답변하려는 적용 질문입니다. 이 경우 그룹 간 차이의 크기 (또는 청중에게 더 친숙한 측정 값 인 경우 그룹의 비율의 크기)를 추정하려는 것 같습니다. 차이의 크기는 질문에 제시 한 분석에 의해 직접 제공되지 않습니다. 그러나 베이지안 분석에서 원하는 것을 얻는 것이 간단합니다. 차이 (또는 비율)의 사후 분포를 원합니다. 그런 다음 차이 (또는 비율)의 사후 분포에서 다음과 같은 직접 확률 진술을 만들 수 있습니다.

"95 % 가장 높은 신뢰도 차이는 [95 % 낮은 HDI 한계]와 [95 % 높은 HDI 한계] 사이에 있습니다"(여기서 95 % 최고 밀도 간격 [HDI]을 신뢰할 수있는 간격으로 사용하고 있습니다. '가장 신뢰할 수있는'것으로 광택 처리 된 최고 밀도 매개 변수 값 정의

의료 저널 사용자는이 진술을 직관적이고 정확하게 이해합니다. 청중이 일반적으로 생각하는 것은 잦은 신뢰 구간의 의미 (비록주의 신뢰 구간의 의미는 아니지만)이기 때문입니다.

Stan 또는 JAGS와의 차이 (또는 비율)를 어떻게 얻습니까? 완성 된 MCMC 체인의 후 처리를 통해서만 가능합니다. 체인의 각 단계에서 관련 차이 (또는 비율)를 계산 한 다음 차이 (또는 비율)의 사후 분포를 조사하십시오. MCDA의 경우 DBDA2E https://sites.google.com/site/doingbayesiandataanalysis/에 대한 예가 일반적으로 그림 7.9 (177 페이지), JAGA (그림 8.6) (p. 211) 및 Stan 16.3 절 (p 468) 등!

2) 전통적으로 제로의 차이가 거부되는지 여부에 대한 진술을 강요받을 경우, 베이지안 옵션은 두 가지가 있습니다.

2A) 하나의 옵션은 0에 가까운 간격과 HDI와의 관계에 관한 확률 진술을하는 것입니다. 이를 위해 실제 동등성 영역 (ROPE)을 0으로 설정합니다. 적용 영역에 적합한 결정 임계 값일뿐입니다. 차이가 크지 않은가? 이러한 경계 설정은 예를 들어 임상 비열 등성 테스트에서 일상적으로 수행됩니다. 필드에 '효과 크기'측정 값이있는 경우 '작은'효과 크기에 대한 규칙이있을 수 있으며 ROPE 한계는 작은 효과의 절반 일 수 있습니다. 그런 다음 다음과 같은 직접 확률 진술을 할 수 있습니다.

"차이의 사후 분포의 1.2 %만이 실질적으로 0과 같습니다"

"95 %의 가장 믿을만한 차이는 모두 실질적으로 0과 같지 않으며 (즉, 95 % HDI와 ROPE는 겹치지 않습니다) 따라서 우리는 0을 거부합니다." (사후 분포로부터의 확률 진술과 그 진술에 근거한 후속 결정 사이의 구별에 주목)

95 %의 가장 신뢰할 수있는 값이 모두 실질적으로 0과 동일한 경우 실제 목적으로 0의 차이를 허용 할 수도 있습니다.

2B) 두 번째 베이지안 옵션은 베이지안 귀무 가설 검정입니다. (위의 방법이 아니라는 점에 유의하십시오.베이지안 귀무 가설 테스트는 차이가 일부 확산 범위 일 수 있다고 가정하는 다른 사전 분포에 대해 차이가 0 일 수 있다고 가정하는 이전 분포의 베이지안 모델 비교를 수행합니다. 이러한 모델 비교의 결과 (대개)는 대체 분포의 특정 선택에 크게 의존하므로 대체 대안을 선택하기 위해 신중하게 정당화해야합니다. 모델 비교가 진정으로 의미가 있도록 널과 대안 모두에 대해 최소한의 정보를 미리 입력하는 것이 가장 좋습니다. 모델 비교는 다른 질문을 다루기 때문에 모델 비교는 그룹 간 차이 추정과는 다른 정보를 제공합니다. 따라서 모델 비교에서도

Stan / JAGS / MCMC 출력에서 ​​베이지안 귀무 가설 검정을 수행하는 방법이있을 수 있지만이 경우에는 모릅니다. 예를 들어, 베이 즈 계수에 대해 Savage-Dickey 근사를 시도 할 수 있지만, 차이에 대한 사전 밀도를 아는 것에 의존 할 수 있으며, 이는 수학적 분석이나 이전의 MCMC 근사를 필요로합니다.

null 값을 결정하는 두 가지 방법은 Ch. DBDA2E 중 12 개 https://sites.google.com/site/doingbayesiandataanalysis/ . 그러나 나는이 논의가 널값을 평가하는 "적절한"방법에 대한 논쟁에 의해 엉망이되기를 원하지 않는다. 그들은 단지 다르고 다른 정보를 제공합니다. 답장의 요점은 위의 1 점입니다. 그룹 간 차이의 사후 분포를 봅니다.


3
우리 사이트에 오신 것을 환영합니다! 커뮤니티의 일원이 되신 것을 기쁘게 생각합니다!
Tim

이 일에 귀하의 계정을 병합 할 경우 stats.stackexchange.com/users/16592 당신을 통해 자동으로 수행 할 수 있습니다 (이 나타납니다 너무 당신을 할 수 있음) stats.stackexchange.com/contact .
amoeba는 Reinstate Monica가

brms를 사용하여 여기에 설명 된 가설 테스트를 수행 할 수 있습니다. 참조 : github.com/paul-buerkner/brms
bjw

3

SO 에티켓에 이어 이것은 @John K. Kruschke에 대한 주석으로 작성 되었어야하지만 긴 주석은 구조화하기가 어렵습니다. 죄송합니다.

  • @John K. Kruschke의 글을 참고하세요 : 완성 된 MCMC 체인의 후 처리를 통해 ...

lower_CredI그리고 upper_CredI당신이 전체 MCMC 체인에서 언급 약간 더 나은 비교를 위해 포맷 될 때 원래의 게시물에 계산 된 lme출력. HDI를 선호하지만 간단한 Quantile입니다. 이 예에서 대칭 후방을 사용하면 큰 차이가 없습니다.

  • ROPE 및 효과 크기

윤리위원회에의 적용은 효과 규모에 대한 가정을 언급하지 않고 통계적 힘이 계산되는 것을 보았습니다. "임상 적으로 관련된 효과"를 정의 할 방법이없는 경우에도이 개념을 의학 연구자들에게 설명하기는 어렵습니다. 비열 등성 시험의 경우 좀 더 쉬우나, 종종 연구 대상이 아닙니다.

그래서 나는 ROPES를 도입하는 것이 용납되지 않을 것이라고 확신합니다. 또 다른 가정은 사람들이 하나 이상의 숫자를 기억할 수 없다는 것입니다. p- 값과 같이 집으로 가져갈 숫자는 하나뿐이기 때문에 Bayes 요인이 효과가있을 수 있습니다.

  • 이전

스탠 팀의 @John K. Kruschke 나 @Ben Goodrich가 이전에 언급 한 것에 놀랐습니다. 주제에 관한 대부분의 논문은 결과를 제시 할 때 사전 감도에 대한 자세한 논의를 요구합니다.

다음 번 책 (Stan에서 희망적으로)에서 선택한 예에 대해 "비 통계 논문으로 100 개 단어로 게시하는 방법"상자를 추가 할 수 있다면 좋을 것입니다. 23.1 장을 한 마디로 가져 가면 일반적인 의학 연구 논문은 100 페이지가 넘고 길이는 길어집니다.


* 요점은 차이의 사후 분포 (그룹 간, 그룹 조합 간)를 살펴 보는 것이 었습니다. 이것이 MCMC 체인의 후 처리가 필요한 것입니다.
John K. Kruschke

* ROPE : 당신은 "ROPE가 받아 들여지지 않을 것이라고 확신합니다"그리고 "의학 연구자들에게 개념을 설명하기 어렵다". Bayes 요소가 결정을 위해 특정 BF 임계 값에 대해 더 정교하게 설명하고 정당화하기 때문에 Bayes 요소가 설명하기 쉽고 수용되는 방법을 알지 못합니다 !! 당신은 당신의 청중이 빈번한 틀에서 영구적으로 골화된다고 가정 한 것 같습니다. 이 경우에 빈번한 통계를 사용하거나 작업을보다 계몽 된 저널에 제출하십시오.
John K. Kruschke

* 당신은 Ch 23.1의 권고에 대해 지나치게 과장한다. 이것은 실제로 여기에서 사용하는 것과 같은 간단한 모델을 위해 적은 양의 텍스트로 간결하게 다룰 수있다. 다음 댓글에서 계속 ...
John K. Kruschke

1
(i) 베이지안의 사용을 동기 부여하십시오. (ii)이 경우 모델과 매개 변수를 쉽게 설명 할 수 있습니다. (iii) 이전에 정당한 영향을 미치지 않는 확산 우선 순위를 사용했다고 가정하기 위해 이전의 사소한 경우를 정당화하십시오. (하지만 이전 요소가 중요한 베이 즈 요인을 사용하는 경우는 아닙니다.) (iv) MCMC 체인의 부드러움을보고합니다. ESS가 모든 매개 변수와 차이에 대해 약 10,000이라고 말하는 것은 사소한 일입니다. 다음 댓글에서 계속 ...
John K. Kruschke

1
(v) 후부 해석 : 각 관심 차이에 대해 후부의 중심 경향 (예 : 모드)과 95 % HDI를 명시하십시오. 트윗만큼 짧지는 않지만 단지 두 단락입니다.
John K. Kruschke
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.