데이터가 정규 분포가 아닌 경우 두 그룹 평균 간의 차이를 테스트하는 방법은 무엇입니까?


19

생물학적 세부 사항과 실험을 모두 제거하고 당면한 문제와 통계적으로 수행 한 작업을 인용하겠습니다. 나는 그것이 올바른지 아닌지, 어떻게 진행하는지 알고 싶습니다. 데이터 (또는 내 설명)가 충분하지 않으면 편집하여 더 잘 설명하려고 노력할 것입니다.

크기가 이고 두 개의 그룹 / 관찰, X 및 Y가 있다고 가정하십시오 . 이 두 관측치의 평균이 같은지 알고 싶습니다. 내 첫 번째 질문은N y = 40Nx=215Ny=40

  1. 가정이 만족되면 여기서 파라 메트릭 2- 표본 t- 검정을 사용하는 것이 적절합니까? 크기가 작을 때 일반적으로 적용되는 것으로 이해하기 때문에 이것을 묻습니다.

  2. 나는 X와 Y의 히스토그램을 플로팅했고, 그것들은 정규 분포가 아니었다. 2- 표본 t- 검정의 가정 중 하나. 혼란스러워서, 나는 그것들을 두 모집단으로 간주하고 그래서 정규 분포를 확인했습니다. 그러나 나는 두 개의 샘플 t- 검정을 수행하려고합니다 ... 맞습니까?

  3. 중앙 한계 정리에서, 나는 당신이 (인구 크기에 따라 반복적으로 / 반복없이) 샘플링을 여러 번 수행하고 매번 샘플의 평균을 계산하면 대략 정규 분포됨을 이해합니다. 그리고이 랜덤 변수의 평균은 모집단 평균의 적절한 추정치입니다. 그래서 저는 이것을 X와 Y에서 1000 번, 1000 번 수행하기로 결정하고 샘플을 얻었으며, 각 샘플의 평균에 랜덤 변수를 할당했습니다. 음모는 매우 정규적으로 분포되었습니다. X와 Y의 평균은 4.2와 15.8 (이는 모집단 +-0.15와 같음)이고 분산은 0.95와 12.11입니다.
    이 두 관측치 (각 1000 개 데이터 포인트)에 대해 분산이 같지 않기 때문에 t- 검정을 수행했습니다. 이는 매우 다르기 때문입니다 (0.95와 12.11). 그리고 귀무 가설은 기각되었습니다.
    이것은 전혀 의미가 있습니까? 이 정확하고 의미있는 접근법이나 2- 표본 z- 검정이 충분합니까, 아니면 완전히 잘못 되었습니까?

  4. 또한 비모수 Wilcoxon 검정을 수행하여 (원본 X 및 Y에서) 확실하게 귀무 가설을 확실하게 기각했습니다. 이전 방법이 완전히 잘못된 경우 통계적 힘을 제외하고 비모수 적 테스트를 수행하는 것이 좋을 것 같습니다.

두 경우 모두 평균이 크게 달랐습니다. 그러나 두 가지 방법 중 하나 또는 둘 다가 잘못되었거나 완전히 잘못된 지 알고 싶습니다. 그렇다면 어떤 대안이 있습니까?

답변:


21

t- 검정이 작은 샘플에 대해서만 있다는 아이디어는 역사적으로 남아 있습니다. 예, 원래는 작은 샘플을 위해 개발되었지만 이론상 작은 것을 큰 것과 구별하는 것은 없습니다. 컴퓨터가 통계를 수행하는 데 일반적으로 사용되기 전날, t- 테이블은 종종 약 30 자유도까지 올라 갔으며 그 이상을 t 분포의 근사치로 사용했습니다. 이것은 t-table의 크기를 합리적으로 유지하기위한 편의를위한 것입니다. 이제 컴퓨터를 사용하여 모든 표본 크기에 대해 t- 검정을 수행 할 수 있습니다 (매우 큰 표본의 경우 z- 검정과 t- 검정 결과의 차이가 매우 작음). 주된 아이디어는 표본을 사용하여 표준 편차를 추정 할 때 t- 검정을 사용하고 모집단 표준 편차가 알려진 경우 z- 검정을 사용하는 것입니다 (매우 드문 경우).

중앙 한계 정리 (Central Limit Theorem)를 사용하면 표본 크기가 충분히 큰 한 모집단이 정규 분포를 따르지 않아도 정규 이론 유추 (이 경우 t- 검정)를 사용할 수 있습니다. 이것은 테스트가 대략적이라는 것을 의미합니다 (그러나 샘플 크기의 경우 승인이 매우 양호해야 함).

Wilcoxon 검정은 평균 검정이 아닙니다 (모집단이 완벽하게 대칭이고 다른 가능성이 거의없는 가정을 알고 있지 않는 한). 수단이 주요 관심 대상이라면 t- 검정이 아마도 인용하기에 더 좋은 방법 일 것입니다.

표준 편차가 너무 다르고 모양이 비정규 적이며 서로 다를 수 있으므로 평균의 차이가 여기서 가장 흥미로운 것은 아닐 수 있습니다. 과학과 결과로 무엇을하고 싶은지 생각해보십시오. 인구 수준 또는 개인 수준에서 결정을 내립니까? 이 예를 생각해보십시오. 당신은 주어진 질병에 대해 2 가지 약물을 비교하고 있습니다. 약물 B에서 모두 생존하고 회복되었지만 회복 시간은 일주일 이상이었다. 이 경우 어떤 평균 복구 시간이 더 짧은 지 정말로 신경 쓰겠습니까? 또는 A에서 반 죽어가는 것을 회복하는 데 정말로 오랜 시간이 걸리는 것으로 대체하십시오 (B 그룹의 누구보다 길다).


그렉 감사합니다. 나는 절차 자체에 아무런 문제가 없다고 생각합니까? 나는 올바른 질문을하지 않을 수도 있지만, 통계 테스트 / 절차와 두 개의 표본이 주어진 것에 대한 이해에 대해서도 관심이 있습니다. 올바른 질문을하고 있는지 확인하고 궁금한 사항이 있으면 다시 알려 드리겠습니다. 생물학적 문제를 설명하면 더 많은 제안이 도움이 될 것입니다. 다시 감사합니다.
Arun

5

Greg의 매우 포괄적 인 답변 중 하나가 추가되었습니다.

내가 당신을 올바르게 이해한다면, 요점 3은 다음 절차를 말합니다 :

  • 분포 의 샘플을 관찰하십시오 .XnX
  • 그런 다음, 값 중 을 그리고 평균을 계산하십시오.nmn
  • 이 1000 번 반복, 해당 수단을 저장
  • 마지막으로, 그 평균의 평균을 계산하고 의 평균이 그런 식으로 계산 된 평균과 같다고 가정하십시오 .X

이제 여러분의 가정은,이 의미에서 중심 한계 정리가 보유하고 대응하는 임의의 변수가 정상적으로 분포 될 것이라고 가정합니다.

어쩌면 오류를 식별하기 위해 계산 배후의 수학을 살펴 보겠습니다.

의 샘플을 호출 하거나 통계 용어로 있습니다. 이제 크기가 표본을 그리고 평균을 계산합니다. 그 의미 의 번째는 어떻게 든 다음과 같습니다.X 1 , , X n X 1 , , X n ~ X m kX X1,,XnX1,,XnXmk

Yk=1mi=1mXμik

여기서 는 draw 에서 그려진 1과 사이의 값을 나타냅니다 . 모든 수단의 평균을 계산하면 N I에게μikni

11000k=110001mi=1mXμik

정확한 수학 용어를 아끼기 위해이 합계를 살펴보십시오. 무엇 발생하면 때문이다 단지 합계에 여러 번 추가됩니다. 모두 모두, 당신은 추가 할 번호에 의해 그들을 분할 . 실제로 임의 가중치 를 사용하여 의 가중치 평균을 계산합니다 . (1000) m (1000) m 개의 X의 Xi1000m1000mXi

그러나 이제 중앙 한계 정리 (Central Limit Theorem)는 많은 독립 랜덤 변수 의 합 이 거의 정상 이라고 말합니다 . (결과도 평균에 가깝습니다).

위의 합계는 독립 샘플을 생성하지 않습니다. 당신은 아마도 임의의 가중치를 가지고 있지만, 샘플을 전혀 독립적으로 만들지는 않습니다. 따라서 3으로 작성된 절차는 합법적이지 않습니다.

그러나 Greg가 이미 언급했듯이 평균에 실제로 관심이 있다면 원래 데이터에 사용하는 것이 거의 정확할 수 있습니다.t


감사합니다. t-test는 이미 CLT를 사용하여 문제를 처리하는 것 같습니다 (간과 한 greg 's reply에서). 그것을 지적하고 3)의 명확한 설명에 대해 감사드립니다. 이러한 개념을 이해하려면 더 많은 시간을 투자해야합니다.
Arun

2
CLT는 현재 분포에 따라 다르게 수행됩니다 (또는 예상 값이나 분포의 분산이 존재하지 않으면 CLT도 유효하지 않음). 의심스러운 경우 항상 관찰 한 것과 유사한 분포를 생성 한 다음이 분포를 사용하여 수백 번 테스트를 시뮬레이션하는 것이 좋습니다. 근사 CLT 소모품의 품질에 대한 느낌을 얻게됩니다.
Thilo
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.