부트 스트랩 테스트를 수행하여 두 샘플의 평균을 비교하는 방법은 무엇입니까?


12

두 개의 심하게 치우친 표본이 있으며 부트 스트랩을 사용하여 t- 통계량을 사용하여 평균을 비교하려고합니다.

올바른 절차는 무엇입니까?


내가 사용하고있는 과정

나는 이것이 정규 분포가 아니라는 것을 알고 마지막 단계에서 원본 / 관측 된 데이터의 표준 오차를 사용하는 것이 적절 할까 걱정하고 있습니다.

내 단계는 다음과 같습니다.

  • 부트 스트랩-무작위 샘플 교체 (N = 1000)
  • t- 분포를 만들기 위해 각 부트 스트랩에 대한 t- 통계량을 계산하십시오.
    T(b)=(X¯b1X¯b2)(X¯1X¯2)σxb12/n+σxb22/n
  • t- 분포의 및 1- \ alpha / 2 백분위 수를 구하여 t 신뢰 구간을 추정합니다.α/21α/2
  • 다음을 통해 신뢰 구간을 확보하십시오.

    CIL=(X¯1X¯2)T_CIL.SEoriginal
    CIU=(X¯1X¯2)+T_CIU.SEoriginal
    여기서
    SE=σX12/n+σX22/n
  • 평균에 유의 한 차이 (예 : 0이 아님)가 있는지 확인하기 위해 신뢰 구간이 떨어지는 위치를 확인하십시오.

나는 또한 Wilcoxon rank-sum을 보았지만 매우 치우친 분포 (예 : 75th == 95th percentile)로 인해 매우 합리적인 결과를 제공하지 않습니다. 이러한 이유로 부트 스트랩 된 t-test를 더 탐색하고 싶습니다.

그래서 내 질문은 :

  1. 이것이 적절한 방법론입니까?
  2. 관찰 된 데이터의 SE가 심하게 치우친 것을 알고있을 때 SE를 사용하는 것이 적절합니까?

가능한 중복 : 부트 스트랩 테스트 또는 비모수 순위 기반 테스트 중 어떤 방법이 선호됩니까?


샘플은 얼마나 큽니까?
Michael M

@Michael Mayer Around 800
CatsLoveJazz

답변:


16

나는 정기적 인 부트 스트랩 테스트를 할 것입니다 :

  • 데이터에서 t- 통계량을 계산하여 저장
  • 귀무 가설이 참이되도록 데이터를 변경하십시오. 이 경우 그룹 1의 그룹 1에서 평균을 빼고 전체 평균을 더하고 그룹 2에 대해서도 동일하게 수행하면 두 그룹의 평균이 전체 평균이됩니다.
  • 이 데이터 세트에서 아마도 20,000의 부트 스트랩 샘플을 가져 오십시오.
  • 각 부트 스트랩 샘플에서 t- 통계량을 계산합니다. 이 t- 통계의 분포는 귀무 가설이 참인 경우 기울어 진 데이터에서 t- 통계의 샘플링 분포의 부트 스트랩 추정치입니다.
  • 관측 된 t- 통계 값보다 크거나 같은 부트 스트랩 t- 통계량의 비율은 값 의 추정치입니다 . 당신은보고 좀 더 잘 할 수 있습니다 보다 큰 또는 관찰 t-통계와 같은 부트 스트랩 t-통계의 수 로 나눈 부트 스트랩 샘플의 수 . 그러나 부트 스트랩 샘플 수가 많으면 차이가 작아집니다.p(+1)(+1)

자세한 내용은 다음을 참조하십시오.

  • AC Davison 및 DV Hinkley (1997)의 4 장 부트 스트랩 방법 및 응용 프로그램 . 케임브리지 : Cambridge University Press.

  • Bradley Efron의 16 장과 Robert J. Tibshirani (1993) 부트 스트랩 소개 . 보카 레이 톤 : 채프먼 & 홀 / CRC.

  • 부트 스트랩 가설 테스트에 대한 Wikipedia 항목.


이것은 본질적으로 Im이하는 일이지만 원래 / 관측 된 t- 통계량이> = 부트 스트랩 된 t- 통계량의 비율을보고 있습니다. 첫 번째 인스턴스에서 치우친 데이터에 대해 t- 검정을해도 괜찮습니까? 이것이 부 스트랩을 수행하려는 이유 중 하나입니다.
CatsLoveJazz

2
기술적으로 부트 스트랩 테스트의 경우 테스트 통계가 필요하므로 문제가되지 않습니다. 실질적으로, t- 검정은 평균을 비교하며, 비뚤어진 데이터의 중앙값은 종종 평균보다 더 의미가 있습니다. 따라서 평균 대신 중간 값을 비교하는 테스트가 더 합리적 일 수 있습니다. 그러나 그것은 귀무 가설에 달려 있으며, 이는 귀하의 선택이며 귀하의 선택입니다.
Maarten Buis

감사합니다. 다른 모든 결과물이이 형식으로되어 있으므로 테스트하고 싶은 의미입니다.
CatsLoveJazz
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.