그룹 차이가 없다는 가설을 테스트하는 방법은 무엇입니까?


39

숫자 종속 변수 (예 : 지능 테스트 점수)를보고있는 두 그룹 (예 : 남성 및 여성)으로 연구를하고 그룹 차이가 없다는 가설이 있다고 가정합니다.

질문:

  • 그룹 차이가 없는지 테스트하는 좋은 방법은 무엇입니까?
  • 그룹 차이가 없는지 적절히 테스트하는 데 필요한 표본 크기를 어떻게 결정 하시겠습니까?

초기 생각 :

  • 귀무 가설을 기각하지 못한다고해서 관심있는 매개 변수가 0이거나 0에 가깝다는 것을 의미하지 않기 때문에 표준 t- 검정을 수행하는 것만으로는 충분하지 않습니다. 이것은 특히 작은 샘플의 경우입니다.
  • 95 % 신뢰 구간을보고 모든 값이 충분히 작은 범위 내에 있는지 확인할 수 있습니다. 아마 ± 표준 편차 플러스 또는 마이너스.

"이것은 귀무 가설이 참이라고 가정한다"는 무슨 뜻입니까?
로빈 지라드

당신이 잘못 선언하는 확률을 제어 할 수 있도록하려면이 두 가지 가설을 분리 할 필요가있다 "차이가 있습니다"(나는 이미 했나요 않았다 나는이 견적 사랑 : stats.stackexchange.com/questions/726/...를 ))
로빈 지라드

@Robin 귀무 가설 유의성 검정의 p 값은 귀무 가설이 참이라고 가정 할 때 관측 된 것보다 더 극단적 인 데이터를 볼 확률입니다. 그러나 아마도 나는 위의 진술을 더 잘 말할 수 있습니다.
Jeromy Anglim

@Robin 내 요점을보다 명확하게하기 위해 질문을 수정했습니다
Jeromy Anglim

답변:


20

나는 당신이 동등성 에 대한 테스트를 요구하고 있다고 생각합니다 . 본질적으로 두 그룹이 효과적으로 동등하다는 결론을 내릴 수있는 차이가 얼마나 큰지를 결정해야합니다. 이 결정은 95 % (또는 다른) 신뢰 구간 한계를 정의하며 샘플 크기 계산은이 기준으로 이루어집니다.

주제에 대한 전체 책 이 있습니다 .

동등성 시험의 매우 일반적인 임상 "동등"은 비열 등성 시험 / 시험 입니다. 이 경우 한 그룹을 다른 그룹보다 "선호"하고 (기존 치료), 새로운 치료가 통계적 증거 수준에서 확립 된 치료보다 열등하지 않음을 나타내도록 테스트를 설계하십시오.

GraphPad.com 사이트 ( "Library" 아래)에 대해 Harvey Motulsky 를 인정해야한다고 생각합니다 .


16

이미 언급 한 어떤 종류의 동등성 테스트 가능성과 더불어 대부분의 사람들은 내가 아는 한 가장 오래된 전통주의 전통에서 대부분 라우팅되고, 실제로 증거의 정량화를 제공하는 테스트를 수행 할 가능성이 있습니다. 귀무 가설, 즉 베이지안 테스트 선호 .

베이지안 t- 검정의 구현은 Wetzels, R., Raaijmakers, JGW, Jakab, E. 및 Wagenmakers, E.-J에서 찾을 수 있습니다. (2009). 귀무 가설에 대한 지원 및 양을 계산하는 방법 : 기본 베이지안 t- 검정의 유연한 WinBUGS 구현. 심리학 적 게시판 및 검토, 16, 752-760.

R에서이 모든 작업을 수행하는 방법에 대한 자습서도 있습니다.

http://www.ruudwetzels.com/index.php?src=SDtest


Kruschke는이 논문에서 베이지안 t- 검정의 대안 (아마도 더 현대적인 접근법)을 코드와 함께 제공합니다.

Kruschke, JK (2013). 베이지안 추정은 t 검정을 대체합니다 . 실험 심리학 저널 : 일반 , 142 (2), 573–603. 도 : 10.1037 / a0029146


이 답변에 대한 모든 소품 (Kruschke를 추가하기 전에)은 내 동료 David Kellen에게 가야합니다. 나는 이 질문 에서 그의 대답을 훔쳤다 .


누군가 베이지안 접근 방식을 제공하는지 궁금합니다. 우수한. 감사.
Jeromy Anglim

1
R에 대한 멋진 BayesFactor 패키지에 대한 참조를 포함하도록이 답변을 업데이트하는 것이 좋습니다.
crsh


8

내가 아는 몇 가지 서류가 도움이 될 수 있습니다.

Tryon, WW (2001). 추론 적 신뢰 구간을 사용한 통계적 차이, 동등성 및 불확실성 평가 : 귀무 가설 통계 테스트를 수행하는 통합 된 대체 방법입니다. 심리학 적 방법, 6, 371-386. ( 무료 PDF )

그리고 수정 :
Tryon, WW, & Lewis, C. (2008). Tryon (2001) 감소 계수를 수정하는 통계적 동등성을 설정하는 추론 적 신뢰 구간 방법. 심리학 적 방법, 13, 272-278. ( 무료 PDF )

더욱이:

선원, MA & Serlin, RC (1998). E 수단의 두 그룹 비교를 위해 quivalence 신뢰 구간 . 심리학 적 방법, Vol 3 (4), 403-411.


이 주제에 관한 많은 논문과 책이 있습니다.
Michael Chernick

7

나는 최근에 두 분포 사이의 거리 가 평균이 아닌 거리를 기반으로 한 "등가 테스트"방법에 대해 생각 했습니다.

두 가우스 분포 의 중첩 에 대한 신뢰 구간을 제공하는 몇 가지 방법이 있습니다 .여기에 이미지 설명을 입력하십시오

O(P1,P2)P1P2

1O(P1,P2)=TV(P1,P2)
P 1 P 2TV(P1,P2)=supA|P1(A)P2(A)|P1 및 .P2

즉, 예를 들어, 수단 다음 에 의해 주어진 확률 어떤 이벤트 이상 다르지 않다 . 대략, 두 분포는 동일한 예측을 최대 만듭니다.P 1 P 2 0.1 10 %O(P1,P2)>0.9P1P20.110%

따라서 고전 동등성 검정에서 와 같이 평균 과 사이의 차이에 대한 임계 값을 기반으로 허용 기준을 사용하는 대신 , 우리는 다음에 의해 제공된 예측확률 차이에 대한 임계 값을 기반으로 할 수 있습니다. 두 분포.μ 2μ1μ2

기준의 "객관성"측면에서 이점이 있다고 생각합니다. 의 임계 값 실제 문제의 전문가에 의해 주어져야합니다. 이것은 그 차이가 실질적으로 중요한 가치가 있어야합니다. 그러나 때로는 실제 문제에 대한 확실한 지식을 가진 사람이 없으며 중요한 가치를 제공 할 수있는 전문가가 없습니다. 에 대한 기존의 임계 값을 채택하는 것은 고려중인 물리적 문제에 의존하지 않는 기준이 될 수 있습니다.T V ( P 1 , P 2 )|μ1μ2|TV(P1,P2)

분산이 동일한 가우시안 경우 중첩은 표준화 된 평균 차이 와 일대일로 관련됩니다 .|μ1μ2|σ


당신은 중복 보여주는 어떤 자원이되고이 있습니까 사용 진짜 문제가? 이것은 매우 유망한 것으로 들리지만 실제 문제에서 어떻게 적용 할 것인지는 분명하지 않습니다 (여러분의 결론은 "이 분포는 X와 매우 유사하다"는 결론을 내릴 가능성이 거의 없기 때문에 그 방법을 이해하기 어렵습니다.) 10 % TV는 추론에 미치는 영향의 크기로 해석됩니다).
Stumpy Joe Pete

1
@StumpyJoePete 나는 내 블로그에 같은 정신으로 무언가를 썼습니다 : stla.github.io/stlapblog/posts/…
Stéphane Laurent

5

의료 과학에서는 두 개의 일방적 인 테스트 (대부분의 테스트)와 달리 신뢰 구간 접근 방식을 사용하는 것이 좋습니다. 또한 포인트 추정치, CI 및 사전 결정된 동등성 마진을 그래프로 표시하여 상황을 명확하게 표시하는 것이 좋습니다.

귀하의 질문은 그러한 접근 방식으로 해결 될 것입니다.

비열 등성 / 동등성 연구에 대한 CONSORT 가이드 라인은 이와 관련하여 매우 유용합니다.

참조 피아 G, Elbourne DR, 알트 DG, Pocock 에스, 에반스 SJ 및 CONSORT 그룹. 비열 등성 및 동등성 무작위 시험의보고 : CONSORT 문의 확장. JAMA. 2006 년 3 월 8 일; 295 (10) : 1152-60. (전체 텍스트로 연결)


1
나는 신뢰 구간이 선호된다고 반드시 말할 필요는 없다. 실제로 신뢰 구간은 가설 검정에 해당합니다. TOST는 절차에서 사용되는 두 개의 단측 t 검정에 해당하는 두 개의 단측 신뢰 구간을 교차하여 얻은 신뢰 구간을 보면 달성 할 수 있습니다.
Michael Chernick

4

예. 이것은 동등성 테스트입니다. 기본적으로 귀무 가설과 대립 가설을 뒤집고 표본 크기를 거듭 제곱하여 평균의 차이가 동등성의 범위 내에 있음을 보여줍니다. 블랙웰 더는 "무 가설 증명"이라고했습니다. 이는 일반적으로 시판되는 약물에 대한 일반 의약품의 동등성이 테스트되거나 승인 된 약물이 새로운 제제 (종종 생물학적 동등성)와 비교되는 제약 임상 시험에서 수행됩니다. 단면 버전을 비열 등성이라고합니다. 때때로 신약이 시중에 판매되는 경쟁자보다 열등하지 않다는 것을 보여줌으로써 의약품을 승인 할 수 있습니다. Shao와 Pigeot는 교차 설계를 사용하여 생체 동등성에 대한 일관된 부트 스트랩 접근 방식을 개발했습니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.