대응 대 비대칭 t- 검정


20

내가 20 마리의 생쥐를 가지고 있다고 가정하자. 나는 어떤 방식으로 마우스를 페어링하여 10 쌍을 얻습니다. 이 질문의 목적 상, 무작위 짝짓기 일 수도 있고, 같은 쓰레기에서 같은 생쥐의 생쥐를 비슷한 체중으로 짝 짓는 것과 같은 합당한 짝짓기 일 수도 있고, 의도적으로 바보 같은 짝짓기 일 수도 있습니다. 가능한 한 무게가 다른 마우스를 사용하려고합니다. 그런 다음 난수를 사용하여 각 쌍의 한 마우스를 컨트롤 그룹에 할당하고 다른 마우스를 치료할 그룹에 할당합니다. 나는 이제 실험을하면서 치료할 생쥐만을 치료하지만, 그렇지 않으면 방금 만든 배열에주의를 기울이지 않습니다.

결과를 분석 할 때 짝을 이루지 않은 t-testing 또는 paired t-testing을 사용할 수 있습니다. 어떤면에서 대답이 달라 집니까? (기본적으로 추정해야하는 통계 매개 변수의 체계적인 차이에 관심이 있습니다.)

내가 묻는 이유는 내가 최근에 관련한 논문이 짝을 이루지 않은 t- 검정이 아니라 짝을 이루는 t- 검정을 사용하는 것으로 생물학자가 비난했기 때문입니다. 물론 실제 실험에서 상황은 내가 스케치 한 상황만큼 극단적이지 않았으며 내 의견으로는 페어링의 이유가 있습니다. 그러나 생물학자는 동의하지 않았습니다.

짝짓기가 부적절하더라도 짝을 이루지 않은 테스트 대신 짝을 이루는 t- 검정을 사용하여 스케치 한 상황에서 통계적 유의성 (p- 값 감소)을 잘못 개선하는 것은 불가능한 것 같습니다. 그러나 마우스가 잘못 페어링되면 통계적 유의성이 나빠질 수 있습니다. 이게 옳은 거니?

답변:


23

나는 Frank와 Peter의 주장에 동의하지만 문제의 핵심에 도달하는 간단한 공식이 있으며 OP가 고려해야 할 가치가 있다고 생각합니다.

하자 와 누구의 상관 관계를 알 수없는 두 확률 변수합니다.Y엑스와이

하자=엑스와이

의 분산은 무엇입니까 ?

다음은 간단한 수식은 다음 어떤 경우 COV ( X , Y는 ) > 0 (즉, XY는 긍정적 인 상관 관계)?

바르()=바르(엑스)+바르(와이)2코브(엑스,와이).
코브(엑스,와이)>0엑스와이

그런 다음 바르()<바르(엑스)+바르(와이). 이 경우 개입 전후에 동일한 주제를 처리 할 때와 같이 양의 상관 관계로 인해 페어링이 이루어지면 독립 페어링 된 차이가 페어링되지 않은 경우에 대한 분산보다 분산이 낮아서 도움이됩니다. 이 방법은 분산을 줄였습니다. 시험이 더 강력합니다. 이것은 주기적 데이터와 함께 극적으로 보여 질 수 있습니다. 워싱턴 DC의 온도가 뉴욕시보다 높은지 확인하려는 책에서 한 예를 보았습니다. 그래서 그들은 두 도시에서 2 년 동안 월 평균 기온을 측정했습니다. 물론 사계절로 인해 일년을 통하여 큰 변화가 있습니다. 이 변이가 너무 커서 쌍을 이루지 않은 t 검정이 차이를 탐지하기에는 너무 큽니다. 그러나 같은 해에 같은 달을 기준으로 페어링하면이 계절 효과와 -test는 DC의 평균 온도가 뉴욕보다 높은 경향이 있음을 분명히 보여주었습니다. X I (월에 뉴욕에서 온도)와 Y 내가 (월에서 DC 온도 A는 계절이 뉴욕과 DC에서 동일하기 때문에) 양의 상관 관계되고, 도시는 종종 것과 같은 날씨 시스템을 경험하게 될 것을 충분히 가까이있다 온도에 영향을 미칩니다. DC는 남쪽에 있기 때문에 조금 더 따뜻할 수 있습니다.엑스나는에이와이나는에이

공분산 또는 상관이 클수록 분산 감소가 커집니다.

이제 가 음 이라고 가정 합니다.코브(엑스,와이)

그런 다음 입니다. 이제 분산이 실제로 증가하기 때문에 페어링이 페어링하지 않는 것보다 나쁩니다!바르()>바르(엑스)+바르(와이)

Y는 무상관 아마 당신이 사용하는 방법은 중요하지 않습니다. Peter의 무작위 페어링 사례는이 상황과 같습니다.엑스와이


3
마이클 때문에 "<"와 ">"단순히 시야에서 사라 텍스트의 큰 붕대를 피하기 위해 웹 페이지에 특별한 의미,이 필수적인 사용하는 것이 방정식에서 X 마크 업 (코드는 각각 "\ lt"및 "\ gt") 이 문제를 일으킨 두 가지 방정식을 표시했습니다. 앞으로는 게시물을 게시 한 후 즉시 게시 한 내용을 읽고 사람들이 자신이 생각하는 것을 볼 수 있도록 마크 업에 문제가있는 경우 언제든지 게시물에 플래그를 지정하십시오. 이자형엑스
whuber

@whuber 감사합니다. 나는 일반적으로 게시 중 및 게시 후 확인합니다. 왜냐하면 특히 첨자를 작성할 때 방정식을 많이 엉망으로 만듭니다. 이 게시물이 누락 된 것은 드문 일이며 아마도 긴 게시물이기 때문에 일어 났으며 부주의하게 내가 원하거나해야 할 일을 계속했습니다. 때로는 전화로 인해주의가 산만 해지고 확인을 잊어 버립니다. 게시물에서 텍스트가 사라지는 특수 기호와 관련하여 나는 그것을 관찰했습니다. 간단한 해결책은 심볼 뒤에 공백을 두는 것입니다. 나는 그것이 과거에 나를 위해 일했다고 생각합니다.
Michael R. Chernick

+1, 실제로 포인트입니다. 참고이 경우 & Y가 완벽하게 상관되는 샘플에 , 바르 ( Z ) = 바르 ( X ) + 바르 ( Y ) . 엑스와이바르()=바르(엑스)+바르(와이)
gung-Monica Monica 복원

@MichaelChernick Cov (X, Y) <0 인 경우, 질문이 있습니다 : 나의 목표가 실험에서 E [X] -E [Y]를 추론하는 것이라면, 짝수 연구를 수행했을 때 내 데이터를 분석해도 여전히 실험 결과가 UNPAIRED 무작위 실험의 실현이라고 가장 할 수 있습니다. 내가 할 수 있습니까? 짝을 이루지 않은 무작위 실험을 실제로 수행 한 경우 동일한 결과를 얻을 수 있기 때문입니다. 그런 다음 각 그룹의 평균을 취하고 (쌍을 무시하고) 두 그룹 평균의 차이를 취할 수 있습니다. 이것은 E [Z]의 편견 추정치입니다. 추정기의 분산을 위해 다음을 사용합니다.
KevinKim

@MichaelChernick 그룹 X와 그룹 Y의 표본 분산을 합산합니다.
KevinKim

7

페어링하는 대신 기본 데이터 모델을 이해하는 것이 좋습니다. 제어되지 않은 이질성을 처리하기 위해 페어링을 수행하는 경우, 일반적으로 페어링이이 변동성 원인을 부분적으로 만 제어하고 다중 회귀가 더 나은 경우가 있습니다 (트윈 연구 제외). 연속 변수에 대한 일치는 종종 그러한 변수에 대한 정확한 일치를 수행 할 수 없기 때문에 잔차 변동을 초래하기 때문입니다.


2
우리 모두가 회귀 분석을해야한다면 David Cox의 책과 같은 실험 설계에 관한 책이 생물학적 실험에서 짝짓기 또는 그룹화의 중요성을 강조하는 이유는 무엇입니까? 페어링은 회귀에 수반되는 선형 의존성의 숨겨진 가정을 피합니다. 그러나 아마도 다른 이유가있을 수 있습니다.
David Epstein

6

두 가지 테스트 (페어링 및 비 페어링)는 서로 다른 질문을하여 서로 다른 답변을 얻을 수 있습니다. 올바른 페어링은 거의 항상 페어링되지 않은 것보다 강력합니다. 이것이 실제로 페어링의 요점입니다. 따라서 페어링이 맞다고 말하면 페어링 된 테스트의 p- 값이 페어링되지 않은 동일한 데이터의 p- 값보다 낮을 수 있습니다. 물론 둘 다 할 수 있고 스스로 볼 수 있습니다.

따라서 귀하의 딜레마에 대한 답변은 통계적인 것이 아니라 실질적인 것입니다. 페어링이 맞습니까?

페어링되지 않은 테스트보다 랜덤 페어링에서 더 중요한 결과를 얻을 수 있습니까? 보자 :

set.seed(2910110192)
x <- rnorm(100, 10, 2)
y <- rnorm(100, 10, 2)
t.test(x, y)
t.test(x, y, paired = T)

그렇습니다. 여기서 차이는 매우 작지만 짝수는 p가 낮습니다. 그 코드를 여러 번 실행했습니다. 놀랍게도 때때로 한 p가 더 낮고 다른 p가 더 낮지 만 모든 경우에 그 차이는 작습니다. 그러나 어떤 상황에서는 p 값의 차이가 클 수 있다고 확신합니다.


답변 주셔서 감사하지만 내 질문에 체계적인 차이를 물었다 . 분명히 x와 y의 장기적으로 x와 y는 때때로 짝이 잘 잡힌 것처럼 보이고 때로는 고의적으로 잘못 짝이 된 것처럼 보입니다. x와 y를 무작위로 선택할 때 p- 값의 분포가 두 테스트에서 동일한 지 여부는 통계적인 질문입니다. 이론적으로 p- 값의 두 가지 이론적 분포를 계산하는 것보다 더 많은 이론적 통계를 알고있는 사람에게는 너무 어렵지 않아야한다고 생각합니다. 내 생각 엔 그들이 같다는 것입니다.
David Epstein

내가 실제로 참여한 경우, unpaired의 p- 값은 약 .04이고 paired .001입니다. 중요한 생물 학자에 따르면, 우리는 .04를 인용해야합니다. 나에 따르면 p- 값의 개선은 우리의 페어링이 유효했음을 강력하게 나타냅니다. 나는 여기 통계에 객관적인 대답과 함께 객관적인 질문이 있다고 주장하며, 특정 쌍의 타당성에 대한 좋은 생물학적 판단의 문제가 아니라고 주장합니다. 중요한 생물 학자.
David Epstein

1
나는 통계가 이야기를 말한다고 생각합니다. 두 결과를 모두 공개해야하지만 데이터가 정확하고 상관 관계가 설명 될 수있는 한, 짝 테스트는 상관 관계를 고려하기 때문에 더 정확합니다.
Michael R. Chernick

5

이제 짝을 이루지 않은 t- 검정과 관련 p- 값에 대해 걱정하는 것이 훨씬 더 잘 이해합니다. 알아내는 것은 흥미로운 여정이었으며 그 과정에서 많은 놀라움이있었습니다. 마이클의 공헌에 대한 조사에서 한 가지 놀라운 결과가 나왔습니다. 실제적인 조언으로는 돌이킬 수 없습니다. 또한, 나는 거의 모든 통계 학자들이 믿는다 고 생각하며이를 뒷받침 할 몇 가지 공감대를 가지고 있습니다. 그러나 이론으로는 말 그대로 정확하지 않습니다. 나는 p- 값에 대한 공식을 계산 한 다음 공식을 사용하여 반대 사례를 만드는 방법을 신중하게 생각함으로써 이것을 발견했습니다. 저는 훈련을받은 수학자이고, 반대 사례는 "수학자의 반대 사례"입니다. 실제 통계에서 볼 수있는 것은 아닙니다. 내가 원래의 질문을 할 때 알아 내려고했던 것의 종류.

반대 예를 제공하는 R 코드는 다음과 같습니다.

vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
    X <- rnorm(vLength)
    Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
    Paired <- t.test(X,Y,var.equal=T,paired=T)
    NotPaired <- t.test(X,Y,var.equal=T,paired=F)
    c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))

다음 기능을 참고하십시오. X와 Y는 차이가 크고 거의 일정한 두 개의 10- 튜플입니다. 많은 유의미한 수치에서 상관 관계는 1.000입니다 .... 비 페어링 테스트의 p- 값은 페어링 된 테스트의 p- 값보다 약 10 ^ 40 배 작습니다. 따라서 이것은 마이클의 설명과 모순됩니다. 마이클의 대답과 관련된 내 대답의 일부는 여기에서 끝납니다.


다음은 베드로의 대답으로 얻은 생각입니다. 원래의 질문에 대해 토론하면서, 나는 다르게 들리는 p- 값의 두 가지 특정 분포가 실제로 동일하다는 의견을 추측했습니다. 나는 이것을 증명할 수있다. 더 중요한 것은 증명이 p- 값의 기본 특성을 나타내므로 텍스트가 설명 할 필요가 없도록 근본적인 것입니다. 아마도 모든 전문 통계 학자들은 그 비밀을 알고있을 것입니다. 그러나 저에게 p- 값의 정의는 항상 이상하고 인공적으로 보였습니다. 통계학 자의 비밀을 알려주기 전에 질문을 구체적으로 설명하겠습니다.

n>1n2(n1)n1자유도. 이 두 분포는 다르므로 지구상에서 관련된 p- 값 분포는 어떻게 동일 할 수 있습니까? 훨씬 더 깊이 생각한 후에야, 추측에 대한이 명백한 해고가 너무 쉽다는 것을 깨달았습니다.

에프:(0,)(0,)[0,1]

=에프(에스)에스
에프(,)[0,)

[0,1]

1[0,1]2(1)[0,1][0,1]


나는 p- 값에 신비한 비밀이 있다고 생각하지 않습니다. 어떤 사람들은 어려움을 겪습니다. 귀무 가설이 참일 때 실제로 관측 된 것보다 값이 극단적이거나 극단적 인 것으로 관찰 될 확률입니다. 나는 당신이 당신의 공식 중 하나에서 그 권리를 가지고 있다고 생각합니다. p- 값이 균일하게 분포되어 있다고 말한 것 같습니다. 예, 귀무 가설이 참일 때 동의합니다. t 검정을 사용하면 귀무 가설이 사실이 아닐 수 있습니다. 그런 다음 p- 값이 일정하지 않습니다. 그것은 가까운 0으로 집중해야한다
마이클 R. Chernick

두 번째로 우리는 두 가지 다른 테스트 통계에 대해 이야기하고 있습니다. 하나는 페어링을 기반으로하고 다른 하나는 귀하의 예에 없습니다. 내 대답에서 언급했는지 여부에 관계없이 짝을 이루지 않은 t 검정은 2n-2 자유도를 갖는 중심 t 분포를 갖는 반면, 쌍을 이루는 t 검정을위한 해당 t 분포는 n-1 자유도를 갖습니다. 따라서 자유도가 높은 것은 다른 것보다 표준 정규 분포에 더 가깝습니다. 이러한 테스트를 실제 데이터에 적용 할 때 문제가됩니까? 아니! n이 상당히 큰 경우에는 아닙니다.
Michael R. Chernick

참고로, 짝 지어진 테스트의 한계는 모든 데이터를 짝지을 수 있어야하는 동일한 샘플 크기를 요구합니다. 그러나 짝을 이루지 않은 테스트는 샘플 크기가 다르면 유효합니다. 따라서 일반적으로 짝을 이루지 않은 테스트는 n + m-2 자유도를 갖습니다.
Michael R. Chernick

당신의 대답은 길고 추상적이며 나는 그것을 극복하려고 노력했지만 나는 반례를 이해하지 못했습니다. 나는 귀무 가설과 실제 데이터를 고려한 곳을 보지 못합니다. 관측 된 p- 값은 주어진 데이터에 대해 검정 통계량에 대한 적절한 t 분포의 적분입니다. 두 t 분포와 동일한 공통 데이터 세트에 대한 숫자를 비교합니다. 관측 된 데이터를 조건으로하면 이러한 균일 분포가 아무런 역할을하지 않습니다. 죄송하지만 귀하의 답변이 실제로 귀하의 질문에 답변 된 것으로 보이지 않습니다.
Michael R. Chernick

Michael : 내가 준 R 코드에 집중했습니다. 실행하는 데 1 초 밖에 걸리지 않습니다. 귀무 가설은 X와 Y가 동일한 정규 분포에서 나온다는 것입니다. 물론 필자의 경우에는 거짓입니다. 내 예제에서 Cov (X, Y)> 0이지만 짝을 이루지 않은 테스트는 짝을 이루는 테스트보다 더 중요합니다.
David Epstein 8

1

다른 관점을 제시하겠습니다. 종종 페어링은 바이어스를 줄이기 위해 수행됩니다. 노출 E가 지속적인 결과 Y에 대한 위험 요소인지에 관심이 있다고 가정하십시오. 각 E + 대상에 대해 E- 인 연령 및 성별 일치 대상을 얻습니다. 이제 페어 드 t- 테스트 또는 페어 드 t- 테스트를 할 수 있습니다. 나는 우리가 명시 적으로 일치하는 것을 설명하고 짝을 이루는 t- 검정을 수행해야한다고 생각합니다. 디자인을 고려한다는 점에서 더 원칙적입니다. 분석에서 일치를 고려할지 여부는 바이어스-분산 트레이드 오프의 문제입니다. 분석에서 일치를 설명하면 편향에 대해 더 많은 보호 기능을 제공하지만 편차를 증가시킬 수 있습니다. 짝을 이루지 않은 t- 검정을 수행하는 것이 더 효율적일 수 있지만, 편견에 대한 보호 기능은 제공하지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.