교차 실험 (페어링) 실험에 대한 오차 막대를 표시하는 방법


19

다음 시나리오는 플롯 생성자로 조사자 (I), 검토 자 / 편집자 (CRAN과 관련이없는 R) 및 나 (M)의 트리오에서 가장 자주 묻는 질문이되었습니다. 우리는 (R)이 전형적인 의료 대장 검토 자라고 가정 할 수 있으며, 각 플롯에는 오류 막대가 있어야한다는 것을 알고 있어야합니다. 그렇지 않으면 잘못됩니다. 통계 검토자가 참여하면 문제는 훨씬 덜 중요합니다.

대본

전형적인 약리학 적 교차 연구에서, 두 가지 약물 A와 B가 포도당 수준에 미치는 영향에 대해 테스트되었습니다. 각 환자는 이월이 없다는 가정하에 무작위 순서로 두 번 검사됩니다. 1 차 평가 변수는 포도당 (BA)의 차이이며, 쌍을 이루는 t- 검정이 적합하다고 가정합니다.

(I) 두 경우 모두 절대 포도당 수준을 보여주는 도표를 원합니다. 그는 오차 막대에 대한 (R)의 욕구를 두려워하고 막대 그래프에서 표준 오차를 요구합니다. 여기서 막대 그래프 전쟁을 시작하지 않겠습니다. _)

두 가지 처리에 대한 막대 그래프 및 SE 포도당

(I) : 사실이 아닙니다. 막대가 겹치면 p = 0.03? 그것은 내가 고등학교에서 배운 것이 아닙니다.

(M) : 여기 쌍 디자인이 있습니다. 요청 된 오차 막대는 전혀 관련이 없으며 쌍으로 된 차이의 SE / CI는 몇 개입니까? 플롯에는 표시되지 않습니다. 선택할 수 있고 데이터가 너무 많지 않으면 다음 그림을 선호합니다.

결합 된 선은 쌍을 표시하고 원래 값을 점으로 표시합니다

추가 1 : 이것은 여러 응답에서 언급 된 평행 좌표 플롯입니다

(M) : 선이 짝을 나타내고 대부분의 선이 올라가면 경사가 중요하기 때문에 올바른 인상입니다.

(I) : 그 사진은 혼란 스럽다. 아무도 그것을 이해하지 못하며 오류 막대가 없습니다 (R은 숨어 있습니다).

(M) : 차이의 관련 신뢰 구간을 보여주는 다른 그림을 추가 할 수도 있습니다. 제로 라인으로부터의 거리는 효과 크기의 인상을줍니다.

(I) : 아무도하지 않는다

(R) : 귀중한 나무를 낭비합니다

(M) : (좋은 독일어로서) : 그렇습니다. 나무 위의 점이 찍 힙니다. 그럼에도 불구하고 우리는 여러 치료와 대조가있을 때 이것을 사용하고 게시하지 않습니다.

차이의 신뢰 구간

어떤 제안 ? 플롯을 만들려면 R 코드가 아래에 있습니다.

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()

오 세상에 @ dieter-menne, 좋은 질문입니다! 기사를 제출하는 저널 유형에 따라 달라집니다. 나는 그래프 전쟁을 피할 것이지만, 그래프 2와 3은 아주 작은 공간에서 많은 정보를 좋아합니다.
doug.numbers

4
Masson and Loftus (2003) 는 종종 언급됩니다. 동일한 그래프의 두 번째 패널에서 차이의 CI를 패널로 표시하는 예제 플롯을 보여줍니다. 그게 내가 모르는 서커스 행복의 모두 (! 그래도 난 당신을 위해 느낌을) 할 것입니다 여부
앤디 W

참조 주셔서 감사합니다 @AndyW. 그것은 요점이지만 문제가 있습니다 : 그것은 심리학입니다. 심리학자의 주제에 대해 의학 리뷰어에 비해 훨씬 더 나은 통계적 배경을 가진 좋은 논문이 많이 있습니다. 나는 주제에 관한 높은 순위의 저널 가이드를 찾을 수 있기를 바랍니다. 그것이 내가 다룰 수있는 유일한 날카로운 칼입니다.
Dieter Menne

답변:


17

평균의 표준 오차를 나타내는 오차 막대가 개체 내 설계에 완전히 적합하지 않다고 가정하면 완전히 정확합니다. 그러나 중복 오차 막대와 중요성에 대한 질문은 또 다른 주제이며,이 주석이 달린 참조 목록의 끝에 다시 올 것입니다.

피험자 내 신뢰 구간 또는 원하는 바를 정확하게 수행하는 오차 막대에 대한 심리학의 풍부한 문헌이 있습니다. 참조 작업은 명확합니다.

Loftus, GR, & MEJ, MEJ (1994). 개체 내 설계에서 신뢰 구간 사용 . 심리학 적 게시판 및 검토 , 1 (4), 476–490. 도이 : 10.3758 / BF03210951

그러나 문제는 개체-내 요인의 모든 수준에 대해 동일한 오류 항을 사용한다는 것 입니다. 이것은 귀하의 경우에 큰 문제가 아닌 것 같습니다 (2 단계). 그러나이 문제를 해결하는 더 현대적인 접근 방식이 있습니다. 가장 주목할만한 점 :

Franz, V. & Loftus, G. (2012). 개체 내 설계의 표준 오류 및 신뢰 구간 : Loftus and Masson 일반화 (1994) 및 대체 설명의 편견 피하기 . 심리학 적 게시판 및 검토 , 1–10. doi : 10.3758 / s13423-012-0230-1

Baguley, T. (2011). 분산 분석에 대한 개체 내 신뢰 구간 계산 및 그래프. 행동 연구 방법 . doi : 10.3758 / s13428-011-0123-7 [ 여기에서 찾을 수 있습니다 ]

후자의 두 논문에서 더 많은 참고 문헌을 찾을 수 있습니다 (두 가지 모두 읽을 가치가 있다고 생각합니다).


연구원들은 CI를 어떻게 해석합니까? 다음 논문에 따르면 나쁘다 :

Belia, S., Fidler, F., Williams, J., & Cumming, G. (2005). 연구원은 신뢰 구간과 표준 오차 막대를 오해 합니다. 심리학 적 방법 , 10 (4), 389–396. 도 : 10.1037 / 1082-989X.10.4.389

겹치거나 겹치지 않는 CI를 어떻게 해석해야합니까?

Cumming, G., & Finch, S. (2005). 눈으로 추론 : 신뢰 구간과 데이터 사진을 읽는 방법 . 미국 심리학자 , 60 (2), 170–180. 도 : 10.1037 / 0003-066X.60.2.170


하나의 최종 생각 (이것은 귀하의 경우와 관련이 없지만) : 하나의 플롯에 분할 플롯 디자인 (예 : 개체 내 및 개체 간 요인)이 있으면 오류 막대를 모두 잊어 버릴 수 있습니다. 나는 (거의) raw.means.plotR 패키지에서 내 기능을 추천 할 것이다 plotrix.


2
매우 유용한 참조 목록. 자신의 아이디어의 많은 함께 가져왔다 커밍 amazon.com/Understanding-New-Statistics-Meta-Analysis-ebook/dp/... (당신이 "새로운 통계"표현에 대해 말하고 싶은 무엇이든간에, 나는 아마 동의합니다.)
닉 콕스


@amoeba 인용 한 Baguley 용지는 Morey 용지 기술을 사용합니다.
Henrik

10

문제는 쌍을 이룬 데이터를 구성하는 가장 좋은 방법에 대한 것만 큼 오류 막대에 관한 것 같지는 않습니다.

본질적으로 오류 막대는 대부분 불확실성을 요약하는 방법입니다. 데이터의 미세한 구조에 대해 말할 수는 없으며 반드시 말할 수는 없습니다.

평행 좌표 플롯 (종종 다른 필드에서 다른 것을 의미하는 용어 인 프로파일 플롯이라고도 함)이 문제에서 언급되었습니다. @Ray Koopman은 이미 기본 산포도를 제안했습니다.

AB(A+B)/2A+B

이 음모의 또 다른 출처는 Neyman, J., Scott, EL 및 Shane, CD 1953입니다. 은하의 공간 분포 : 특정 모델. 천체 물리학 저널 117 : 92–133.

넓은 범위에서, 이러한 음모는 Tukey와 그의 형 제곱 Anscombe에 의해 대중화되는 잔차 대 적합치의 음모와 유사합니다.

AB=0A=BAB

무시 된 설계는 McNeil, DR 1992의 평행선 도표입니다. 쌍으로 된 데이터를 그래프로 표시합니다. 미국 통계 학자 46 : 307–310. 이것은 아래 두 참조에서 논의됩니다.

여러 참고 문헌이있는 Stata-linked reviews는

2004 년, 그래프 계약 및 불일치. Stata Journal 4 : 329-349.

.pdf는 http://www.stata-journal.com/sjpdf.html?articlenum=gr0005 에서 액세스 할 수 있습니다 .

변경, 상관 관계 및 기타 비교에 대한 쌍, 병렬 또는 프로파일 플롯. Stata Journal 9 : 621-639.

.pdf는 http://www.stata-journal.com/sjpdf.html?articlenum=gr0041 에서 액세스 할 수 있습니다 .

비 Stata 사용자는 Stata 코드를 건너 뛰고 윙윙 거리면서 자신이 선호하는 소프트웨어로 그래프를 구현하는 방법을 연구 할 수 있어야합니다.

AB


4

개별 (A, B) 점의 산점도를 시도하십시오. 그들 대부분은 대각선의 한쪽에만 있어야합니다 (A = B 선). 오차 막대에 대한 두 가지 아날로그가 있습니다. 평균 차이에 대한 CI와 동등한 기존의 것은 평균 차이에 대한 신뢰 대역입니다. 밴드는 두 선 사이의 영역이며 둘 다 대각선에 평행합니다. 쌍의 t- 검정은 밴드의 양쪽 가장자리가 대각선의 같은쪽에있는 경우에만 중요합니다.

보다 보수적 인 오차 막대 아날로그는 중심에 대한 신뢰 타원입니다.


1
cmethodBcmethodA

아니, cl. -:) 임상 화학이 너무 정교합니다. "저기"에 약간의 참조를 추가했을 수도 있습니다. 당신이 무슨 종이를 말하고 있는지 잘 모르겠습니다.
Dieter Menne 2016 년

4

예비 요약 :

Masson / Loftus 는 매우 철저하며 "상호 작용"과 같은 것을 받아들이지 않는 의료진에게 쉽게 읽을 수있는 책이 아닙니다. 또한 다중 비교에 대한 몇 가지 제안이 있는데, 이는 한 쌍의 신뢰 구간이 크게 단순화하고 싶지 않은 경우 설명하기 어렵다는 것을 보여줍니다.

메이슨 로프 터스

이 스타일이 마음에 들지 않습니다. 오류 막대가있는 막대는 마지막 천년 Excelish처럼 보입니다. 그러나 그들은 또한 좀 더 우아한 스타일을 사용합니다.

바없는 Masson Loftus

Cumming / Finch and Belia et al. 독서해야합니다. 첫 번째는 친구가 단어 상호 작용 을 볼 때 떨리는 친구에게주는 완벽한 선택 입니다. 나는 그 기사를 읽은 후 커밍의 책을 주문했다. 두 번째는 다음 의료 수사관 회의를 위해 Shiny 에서 구현할 테스트를 보여줍니다 .

커밍 / 핀치

이전에 사용한 적이없는 두 번째 축이 있어도이 줄거리가 마음에 듭니다. R- 기반 그래픽 방법을 위해 Henrik와 StackOverflow에 대한 다른 사람들의 기여를 확인 하십시오. 값의 변화를 분명히하기 위해 두 번째 축을 차이의 왼쪽에 배치하고 p 값 축을 추가하는 것이 좋습니다.

격자 / ggplot 분수에서 촬영 한 사람이 있습니까? 제공된 모든 솔루션은 기본 그래픽이며 패널화 가능 / 페이스 테이블이 아닙니다.

그러나 의견과 논문은 대부분 심리학과 (및 하드 코어 화학의 @cbeleites)에서 온 것입니다. 의료 저널의 리뷰어로부터 의견을 얻는 것이 좋습니다.


0

왜 각 환자의 차이 *를 도표로 나타내지 않습니까? 그런 다음 히스토그램, 상자 그림 또는 정규 확률도를 사용하여 차이에 대한 95 % 신뢰 구간을 오버레이 할 수 있습니다.

  • 일부 시나리오에서는 로그의 차이 일 수 있습니다. 예를 들어 Patterson & Jones, "임상 약리학에서의 생물학적 동등성과 통계", Chapman, 2006을 참조하십시오.

왜 안돼? 유효한 정보를 제공 할 수 있지만 개별 점 또는 쌍이있는 도표는 의료 연구에서 실제로 인기가 없습니다. 그렇기 때문에 더 많은 정보를 제공하는 병렬 플롯이 인기가없는 이유입니다. 의학 연구자들은 평균과 "정상 범위"(무엇이든)를 원합니다.
Dieter Menne 2016 년
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.