종속 표본 t- 검정에 대한 코헨의 d


10

빠른 질문 : Cohen의 d는 의존적 샘플 t- 검정 (예를 들어, 샘플 전 / 후 시점에서 약물의 효능을 테스트하는 샘플 내 설계)에 대해 두 가지 다른 방법을 계산 한 것을 보았습니다.

  1. Cohen d에 대한 방정식의 분모에서 변화 점수의 표준 편차를 사용하여 d.
  2. Cohen d에 대한 방정식의 분모에서 사전 테스트 점수의 표준 편차를 사용하여 d.

실제로 어느 옵션을 사용할지 그리고 / 또는 언제 사용할 지에 대한 문서는 거의 없습니다.

빠른 생각이 있습니까?


쌍체 표본 t- 검정에 대한 코헨의 d를 계산하는 방법을 발견 했습니까?
user552231

@ user552231 Cochen 's D에 대한 오픈 소스 R 코드가 있습니다.
HelloWorld

답변:


6

Geoff Cumming은이 문제에 대해 몇 가지 의견을 제시합니다 ( Cumming, 2013 에서 발췌 ).

그러나 대부분의 경우 표준화의 최선의 선택은 문제의 영향에 대한 추론을 수행하는 데 필요한 SD가 아니다. 예를 들어, 단일 참가자 그룹이 사전 테스트 및 사후 테스트 데이터를 모두 제공하는 간단한 사전 사후 실험과 같은 페어링 된 디자인을 고려하십시오. 가장 적합한 표준화 도구는 사실상 항상 사전 테스트 모집단의 SD 추정치, 아마도 데이터의 사전 테스트 SD 인 (Cumming, 2012, 290-294; Cumming & Finch, 2001, 568-570) . 대조적으로, 차이에 대한 추론은 페어링 된 t 검정에 대해 또는 차이에 대한 CI를 계산하든간에 차이의 SD 인 가 필요합니다 (Cumming & Finch, 2005). 사전 테스트 및 사후 테스트 점수가 서로 관련이있는 한s1sdiffsdiff 보다 작을 경우 실험이 더 민감 표준화 도구로 를 사용하여 잘못 계산 된 d 값 이 너무 커집니다.s1sdiff

페어 디자인에서 를 표준화 자로 선택하는 주된 이유 는 사전 테스트 모집단 SD가 사실상 항상 참조 단위로서 최상의 개념적 의미를 갖기 때문입니다. 또 다른 중요한 이유는 다른 사전 테스트-사후 테스트 상관 관계가있는 다른 쌍으로 된 설계 실험과 독립 그룹 설계를 포함한 다른 설계 실험에 의해 주어진 d 값과 비교할 가능성이있는 d 값을 얻는 것입니다. 같은 효과. 이러한 모든 경우의 d 값은 동일한 표준화 장치 (제어 또는 사전 테스트 SD)를 사용하기 때문에 비교할 수 있습니다. 이러한 비교 가능성은 메타 분석과 맥락에서 의미있는 해석에 필수적입니다.spre


3

나는 심리학의 프론티어에서 정식 답변을 찾았습니다 . 경우 테스트 통계이며, 다음 번호 관측된다 :tN

d=tN

이것은 평균 변화가 변화 점수의 표준 편차 (질문에서 1로 표시됨)의 관점에서 표준화 된 표준화 된 평균 변화를 제공합니다.
Wolfgang

0

다음은 피험자 간 또는 피험자 간 설계에 대한 신뢰 구간과 함께 헤지스 g (편의되지 않은 코헨 d의 버전)를 계산하는 제안 된 R 함수입니다.

gethedgesg <-function( x1, x2, design = "between", coverage = 0.95) {
  # mandatory arguments are x1 and x2, both a vector of data

  require(psych) # for the functions SD and harmonic.mean.

  # store the columns in a dataframe: more convenient to handle one variable than two
  X <- data.frame(x1,x2)

  # get basic descriptive statistics
  ns  <- lengths(X)
  mns <- colMeans(X)
  sds <- SD(X)

  # get pairwise statistics
  ntilde <- harmonic.mean(ns)
  dmn    <- abs(mns[2]-mns[1])
  sdp    <- sqrt( (ns[1]-1) *sds[1]^2 + (ns[2]-1)*sds[2]^2) / sqrt(ns[1]+ns[2]-2)

  # compute biased Cohen's d (equation 1) 
  cohend <- dmn / sdp

  # compute unbiased Hedges' g (equations 2a and 3)
  eta     <- ns[1] + ns[2] - 2
  J       <- gamma(eta/2) / (sqrt(eta/2) * gamma((eta-1)/2) )
  hedgesg <-  cohend * J

  # compute noncentrality parameter (equation 5a or 5b depending on the design)
  lambda <- if(design == "between") {
    hedgesg * sqrt( ntilde/2)
  } else {
    r <- cor(X)[1,2]
    hedgesg * sqrt( ntilde/(2 * (1-r)) )
  }

  # confidence interval of the hedges g (equations 6 and 7)
  tlow <- qt(1/2 - coverage/2, df = eta, ncp = lambda )
  thig <- qt(1/2 + coverage/2, df = eta, ncp = lambda )

  dlow <- tlow / lambda * hedgesg 
  dhig <- thig / lambda * hedgesg 

  # all done! display the results
  cat("Hedges'g = ", hedgesg, "\n", coverage*100, "% CI = [", dlow, dhig, "]\n")

}

사용 방법은 다음과 같습니다.

x1 <- c(53, 68, 66, 69, 83, 91)
x2 <- c(49, 60, 67, 75, 78, 89)

# using the defaults: between design and 95% coverage
gethedgesg(x1, x2)

# changing the defaults explicitely
gethedgesg(x1, x2, design = "within", coverage = 0.90 )

도움이 되길 바랍니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.