작은


14

나는 4 가지 다른 시점 (치료 전, 치료 하루, 치료 후 4 주, 치료 후 2-4 개월)에서 철 수준에 대한 치료 효과를 조사한 연구에 대한 데이터를 받았다. 컨트롤 그룹이 없습니다. 그들은 치료 전 3 개의 시점에서 치료 전 (기준) 수준까지 철 수준의 유의 한 증가가 있는지 확인하려고합니다. 11 명의 환자는 기준선 수준을 가졌지 만 8 명의 환자 만이 4 개의 모든 시점에 대해 완전한 데이터를 가졌다 ( 각 시점에 대해 n = 11, 10, 9 및 8). 철 수준을 측정했을뿐만 아니라 기준점과 비교하기 위해 각 시점에서 두 가지 다른 실험실 측정을 수행했습니다.

이것을 분석하는 방법에 대한 몇 가지 질문이 있습니다. 먼저이 데이터를 분석하는 데 RM ANOVA가 적합하다고 생각했지만 작은 표본 크기, 데이터 손실 및 비정규 데이터 분포에 대해 우려했습니다. 그런 다음 Wilcoxon 부호 순위 테스트를 사용하여 각 치료 후 측정 값을 기준선과 비교하는 것을 고려했지만 여러 비교 문제가 발생했습니다. 그러나 여러 번의 비교를 수행 해야하는 다운 플레이에 대한 문헌을 읽었습니다. 전체적으로, 나는 작은 표본 크기, 불완전한 데이터 및 다중 비교 (필요 여부)를 다루고 있습니다.

이 모든 것이 이해 되었기를 바랍니다. 저는 CrossValidated를 처음 사용하고 경험있는 통계 학자로부터 배울 수있는 장소로 동료가이 곳을 방문 했으므로 조언을 부탁드립니다! 감사!


주석에서 원시 데이터를 추가하도록 편집되었습니다.

총 4 개의 시점이 있으며 결과 변수는 연속적입니다. 예를 들어 각 시점의 결과는 다음과 유사합니다.

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]

1
재현 가능한 예제 (또는 원시 데이터)를 추가하면 도움이 될 것입니다.
Ladislav Naďo

결과 변수는 연속적입니다. 예를 들어 각 시점의 결과는 다음과 유사합니다. 기준 수준 n = 11 : [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]. 제 1 포스트 n = 10 [167, 200, 45, 132,., 245, 199, 177, 134, 298, 111]. 제 2 포스트 n = 9 [75, 43, 23, 98, 87,., 300,., 118, 202, 156]. 제 3 포스트 레벨 n = 8 [23, 34, 98, 112,., 200,., 156, 54, 18,.]. 총 4 개의 시점이 있습니다.
msturm17

답변:


5

나는 당신의 문제를 다시 생각하고 Friedman의 테스트를 반복 측정을 통해 일원 분산 분석의 비모수 버전 인 것으로 나타났습니다 .

에 대한 기본적인 기술이 있기를 바랍니다 R.

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

Friedman의 테스트를 수행하십시오.

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

비모수 사후 테스트에 의해 차이가 존재하는 그룹을 찾습니다 . 여기에 가능한 모든 비교가 있습니다.

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

보시다시피 기준선 (첫 번째 시점) 만 통계적으로 다른 기준과 다릅니다.

이것이 도움이되기를 바랍니다.


1
Ladislav, 이것은이 질문에 대한 훌륭한 답변입니다. 매우 철저하고 완전합니다. 내가 볼 수있는 유일한 문제는 Kruskal-Wallis ANOVA의 관측 독립성에 대한 가정을 가지고 있기 때문에 독립 변수의 각 수준마다 다른 주제가 있기 때문에이 경우 우리는 같은 11을 따르지 않습니다. 4 개 시점에서 환자. 이에 대한 의견이 있거나이 문제를 해결하기위한 다른 방법을 염두에두고 있습니까? 정말 고마워!
Matt Reichenbach

위의 의견을 삭제했습니다. 마침내 더 나은 테스트를 찾았습니다. 즐겨 !
Ladislav Naďo

이것은 내 원래 질문이 아닙니다. @ msturm17은 귀하의 답변을 수락해야 할 것입니다.
Matt Reichenbach

시간을내어 내 질문에 철저히 응답 해 준 Ladislav에게 감사합니다!
msturm17

2

시간에 따른 개별 변경의 분포를 모르는 경우 환자 간 차이의 분포로 근사 할 수 없습니다. 예를 들어, 치료 전 철 수준 (510,520, ..., 600)이 10 명이고 치료 후 (520,530, ..., 610)이있는 환자의 경우 Kruskal-Wallis ANOVA (또는 기타 유사한 알고리즘)는 철분 수준에는 큰 변화가 없습니다.

IMHO는 대조군이 없으면 철분을 증가시킨 환자 수와 철수를 감소시킨 환자 수를 세고 그 중요성을 테스트하는 것입니다.

즉, KW ANOVA는 철분 수준이 유의미하다고 말하면 (오 탐지)입니다.


1
예, 오 탐지가 없습니다! 하하, 답변 주셔서 감사합니다. 얼마나 많은 환자가 철분 수준을 증가 시켰는지, 얼마나 많은 사람이 철 수준을 줄 였는지 세는 것과 관련하여 "이의 중요성을 테스트"할 것을 어떻게 제안하십니까? 감사!
Matt Reichenbach

2
미디엄=2(미디엄+)케이=0미디엄(미디엄+케이)

감사합니다! 이것은 내 질문을 보는 또 다른 흥미로운 방법이며 내 데이터에 어떻게 적용되는지 볼 것입니다.
msturm17
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.