종속 표본 t- 검정에 대한 코헨의 d

10

빠른 질문 : Cohen의 d는 의존적 샘플 t- 검정 (예를 들어, 샘플 전 / 후 시점에서 약물의 효능을 테스트하는 샘플 내 설계)에 대해 두 가지 다른 방법을 계산 한 것을 보았습니다.

Cohen d에 대한 방정식의 분모에서 변화 점수의 표준 편차를 사용하여 d.
Cohen d에 대한 방정식의 분모에서 사전 테스트 점수의 표준 편차를 사용하여 d.

실제로 어느 옵션을 사용할지 그리고 / 또는 언제 사용할 지에 대한 문서는 거의 없습니다.

빠른 생각이 있습니까?

t-test effect-size

— 영광
소스

쌍체 표본 t- 검정에 대한 코헨의 d를 계산하는 방법을 발견 했습니까?

— user552231

@ user552231 Cochen 's D에 대한 오픈 소스 R 코드가 있습니다.

— HelloWorld

다음 논문 의 보충 데이터 시트 를 보다 잘 활용하십시오 . Lakens D (2013) 누적 과학을 촉진하기위한 효과 크기 계산 및보고 : t- 검정 및 분산 분석을위한 실용적인 프라이머. 프론트 사이코 롤 4 : 863.

— Daniel

6

Geoff Cumming은이 문제에 대해 몇 가지 의견을 제시합니다 ( Cumming, 2013 에서 발췌 ).

그러나 대부분의 경우 표준화의 최선의 선택은 문제의 영향에 대한 추론을 수행하는 데 필요한 SD가 아니다. 예를 들어, 단일 참가자 그룹이 사전 테스트 및 사후 테스트 데이터를 모두 제공하는 간단한 사전 사후 실험과 같은 페어링 된 디자인을 고려하십시오. 가장 적합한 표준화 도구는 사실상 항상 사전 테스트 모집단의 SD 추정치, 아마도 데이터의 사전 테스트 SD 인 (Cumming, 2012, 290-294; Cumming & Finch, 2001, 568-570) . 대조적으로, 차이에 대한 추론은 페어링 된 t 검정에 대해 또는 차이에 대한 CI를 계산하든간에 차이의 SD 인 가 필요합니다 (Cumming & Finch, 2005). 사전 테스트 및 사후 테스트 점수가 서로 관련이있는 한 $s_1$ $s_{diff}$ $s_{diff}$ 보다 작을 경우 실험이 더 민감 표준화 도구로 를 사용하여 잘못 계산 된 d 값 이 너무 커집니다. $s_1$ $s_{diff}$

페어 디자인에서 를 표준화 자로 선택하는 주된 이유 는 사전 테스트 모집단 SD가 사실상 항상 참조 단위로서 최상의 개념적 의미를 갖기 때문입니다. 또 다른 중요한 이유는 다른 사전 테스트-사후 테스트 상관 관계가있는 다른 쌍으로 된 설계 실험과 독립 그룹 설계를 포함한 다른 설계 실험에 의해 주어진 d 값과 비교할 가능성이있는 d 값을 얻는 것입니다. 같은 효과. 이러한 모든 경우의 d 값은 동일한 표준화 장치 (제어 또는 사전 테스트 SD)를 사용하기 때문에 비교할 수 있습니다. 이러한 비교 가능성은 메타 분석과 맥락에서 의미있는 해석에 필수적입니다. $s_{pre}$

— 드 마틴
소스

3

나는 심리학의 프론티어에서 정식 답변을 찾았습니다 . 경우 테스트 통계이며, 다음 번호 관측된다 : $t$ $N$

d = \frac{t}{\sqrt{N}}

$d = \frac{t}{\sqrt{N}}$

Lakens, D. (2013). 누적 과학을 촉진하기위한 효과 크기 계산 및보고 : t- 검정 및 분산 분석을위한 실용적인 프라이머 . 심리학의 개척자, 4 .

— 사용자 552231
소스

이것은 평균 변화가 변화 점수의 표준 편차 (질문에서 1로 표시됨)의 관점에서 표준화 된 표준화 된 평균 변화를 제공합니다.

— Wolfgang

0

다음은 피험자 간 또는 피험자 간 설계에 대한 신뢰 구간과 함께 헤지스 g (편의되지 않은 코헨 d의 버전)를 계산하는 제안 된 R 함수입니다.

gethedgesg <-function( x1, x2, design = "between", coverage = 0.95) {
  # mandatory arguments are x1 and x2, both a vector of data

  require(psych) # for the functions SD and harmonic.mean.

  # store the columns in a dataframe: more convenient to handle one variable than two
  X <- data.frame(x1,x2)

  # get basic descriptive statistics
  ns  <- lengths(X)
  mns <- colMeans(X)
  sds <- SD(X)

  # get pairwise statistics
  ntilde <- harmonic.mean(ns)
  dmn    <- abs(mns[2]-mns[1])
  sdp    <- sqrt( (ns[1]-1) *sds[1]^2 + (ns[2]-1)*sds[2]^2) / sqrt(ns[1]+ns[2]-2)

  # compute biased Cohen's d (equation 1) 
  cohend <- dmn / sdp

  # compute unbiased Hedges' g (equations 2a and 3)
  eta     <- ns[1] + ns[2] - 2
  J       <- gamma(eta/2) / (sqrt(eta/2) * gamma((eta-1)/2) )
  hedgesg <-  cohend * J

  # compute noncentrality parameter (equation 5a or 5b depending on the design)
  lambda <- if(design == "between") {
    hedgesg * sqrt( ntilde/2)
  } else {
    r <- cor(X)[1,2]
    hedgesg * sqrt( ntilde/(2 * (1-r)) )
  }

  # confidence interval of the hedges g (equations 6 and 7)
  tlow <- qt(1/2 - coverage/2, df = eta, ncp = lambda )
  thig <- qt(1/2 + coverage/2, df = eta, ncp = lambda )

  dlow <- tlow / lambda * hedgesg 
  dhig <- thig / lambda * hedgesg 

  # all done! display the results
  cat("Hedges'g = ", hedgesg, "\n", coverage*100, "% CI = [", dlow, dhig, "]\n")

}

사용 방법은 다음과 같습니다.

x1 <- c(53, 68, 66, 69, 83, 91)
x2 <- c(49, 60, 67, 75, 78, 89)

# using the defaults: between design and 95% coverage
gethedgesg(x1, x2)

# changing the defaults explicitely
gethedgesg(x1, x2, design = "within", coverage = 0.90 )

도움이 되길 바랍니다.

— 데니스 쿠 시노
소스