부트 스트랩 대 순열 가설 검정


37

부트 스트래핑, 순열 테스트, 잭나이프 등과 같이 실제로 자주 사용되는 몇 가지 널리 사용되는 리샘플링 기술이 있습니다. 필립 I 굿 (2010) 순열, 매개 변수 및 부트 스트랩 테스트와 같은 많은 기사와 서적에서 이러한 기술에 대해 설명합니다. 가설

내 질문은 어떤 리샘플링 기술이 더 인기를 얻고 구현하기가 더 쉽습니까? 부트 스트랩 또는 순열 테스트?


8
인기는 품질의 좋은 척도가 아닙니다. 인용 횟수 (고객)로 판단 할 때 McDonalds는 3 성급 Michelin 시설보다 훨씬 인기있는 식당입니다. 그렇다면 다음 세미나 연설자를 맥도날드로 데려가시겠습니까?
StasK

답변:


68

둘 다 대중적이고 유용하지만 주로 다른 용도로 사용됩니다. 순열 검정은 가설 검정에 가장 적합하며 부트 스트랩은 신뢰 구간 추정에 가장 적합합니다.

순열 테스트는 교환 가능성에 대한 특정 귀무 가설을 테스트합니다. 즉, 랜덤 샘플링 / 랜덤 화만이 보이는 차이를 설명합니다. 이것은 t- 검정 및 분산 분석과 같은 일반적인 경우입니다. 또한 시계열 (일련 상관 관계가 없다는 귀무 가설) 또는 회귀 (관계가없는 귀무 가설)와 같은 것으로 확장 될 수 있습니다. 순열 테스트를 사용하여 신뢰 구간을 만들 수 있지만 합리적이거나 합리적이지 않은 더 많은 가정이 필요합니다 (따라서 다른 방법이 선호 됨). Mann-Whitney / Wilcoxon 검정은 실제로 순열 검정의 특별한 경우이므로 일부는 인식하는 것보다 훨씬 인기가 있습니다.

부트 스트랩은 샘플링 프로세스의 변동성을 추정하고 신뢰 구간을 추정하는 데 효과적입니다. 이 방법으로 가설 검정을 수행 할 수 있지만 순열 검정 가정이 유지되는 경우 순열 검정보다 강력하지 않은 경향이 있습니다.


2
답변 해주셔서 감사합니다. 부트 스트랩 신뢰 구간이 순열 테스트보다 강력하지 않은 이유는 무엇입니까? 얼마나 요? 훨씬 덜 강력한 상황을 특성화 할 수 있습니까? 신뢰 구간을 표시 할 수있는 이점이 있으므로 부트 스트랩이 더 중요해 보입니다.
dfrankow

2
@dfrankow, 두 가지 방법은 다른 가정을 사용합니다. 큰 표본과 차이의 경우 모두 양호하지만 표본 / 차가 작을수록 순열 검정이 차이를 발견하고 적절할 가능성이 높습니다. 부트 스트랩의 크기가 올바르게 설정되지 않은 예 (널이 참일 경우 너무 자주 거부 됨)는 이 답변 : stats.stackexchange.com/questions/112147/… 을 참조하십시오 .
Greg Snow

부트 스트래핑에 대한 순열 테스트 변형이 아닙니까?
Vicki B

@VickiB, 부트 스트랩 핑 및 순열 테스트는 종종 함께 언급되지만, 교체없이 교체 및 순열 샘플을 사용하여 샘플을 증폭시키는 것은 수행 할 수있는 작업과 성능에 차이를 만듭니다.
Greg Snow


8

내 질문은 어떤 리샘플링 기술이
부트 스트래핑 또는 순열 테스트 중 더 인기를 얻었 습니까?

  1. 부트 스트랩은 주로 큰 표본 표준 오류 또는 신뢰 구간 생성에 관한 것입니다. 이름에서 알 수 있듯이 순열 테스트는 주로 테스트에 관한 것입니다. (각각 다른 작업에 사용되도록 조정할 수 있습니다.)

  2. 우리는 어떻게 인기를 판단합니까? 심리학과 교육과 같은 분야를 살펴보면 Wilcoxon-Mann-Whitney, 서명 된 순위 테스트, 순위 상관 테스트 등과 같은 순위 기반 테스트를 많이 사용할 수 있습니다. 이것들은 모두 순열 테스트입니다. 반면에 원본 데이터의 순열 테스트를 대신 사용할 수 있지만 일반적으로 사용되지 않는 경우가 많습니다. 일부 다른 응용 분야에서는 순열 테스트가 거의 사용되지 않지만 응용 분야에 따라 다양한 인기가 유용성보다 지역 문화에 대해 더 많은 경우가 있습니다.

쉽게 구현할 수 있습니까?

많은 경우에, 특히 간단한 것들이 거의 똑같이 쉽습니다. 이는 교체를 통한 샘플링과 교체없는 샘플링의 차이입니다.

좀 더 복잡한 경우 부트 스트랩은 (테스트 관점에서 보았을 때) null 대신 다른 방식으로 작동하기 때문에 (적어도 순진한 구현은-제대로 작동하도록하기 때문에) 부트 스트랩이 더 쉽습니다. 훨씬 더 복잡 할 수 있습니다).

보다 복잡한 경우에는 적절한 교환 가능한 수량을 관찰 할 수 없기 때문에 정확한 순열 테스트가 어려울 수 있습니다. 종종 거의 교환 가능한 수량이 정확한 가격으로 대체 될 수 있습니다 (정확하게 분배되지 않음).

부트 스트랩은 기본적으로 처음부터 해당 정확도 기준 (정확한 간격 적용 범위)을 포기하는 대신 큰 샘플에서 합리적으로 좋은 적용 범위를 얻는 데 중점을 둡니다 (때로는 이해되지 않을 수도 있지만 성공하지 못한 경우도 있습니다). 부트 스트랩이 예상 범위를 제공한다고 가정하지 마십시오).

순열 테스트는 작은 샘플에서 작동 할 수 있습니다 (심지어 제한된 수준의 선택은 때때로 매우 작은 샘플에서 문제가 될 수 있음). 반면 부트 스트랩은 큰 샘플 기술입니다 (작은 샘플과 함께 사용하는 경우 결과가 그렇지 않을 수 있음) 매우 유용합니다).

나는 그것들을 같은 문제에 대해 경쟁자로 간주하는 경우가 거의 없으며 (다른) 실제 문제에 사용했습니다.

두 가지 모두에 이점이 있지만 파나 카아에는 없습니다. 이 중 하나에 만 집중하여 학습 노력을 줄이려면 실망 할 것입니다. 둘 다 리샘플링 도구 상자의 필수 요소입니다.


1
" 적절한 교환 가능한 수량을 관찰 할 수 없음 "이 무엇을 의미 하는지 명확 하게 설명해 주 시겠습니까? (+1 명백히)
usεr11852는

1
두 가지 요인과 공변량을 가진 실험에서 순열 테스트를 수행해보십시오 (또는 여러 예측 변수를 사용한 회귀를 고려하십시오). 독립성이 있고 전혀 효과가없는 경우에는 관측 값을 교환 할 수 있으므로 해당 가설을 검정 할 수 있지만 요인의 순열 검정을 구성 할 수있는 방법은 없습니다 (공변량에 영향을 미칠 것으로 예상되므로) null인지 테스트하는 것은 흥미롭지 않습니다.) 마찬가지로 두 요인 중 하나에 대해서만 순열 검정을 구성 할 수 없습니다. ... ctd
Glen_b

1
ctd ... 테스트하지 않는 모집단 계수 (및 오류를 항상 교환 할 수 있음)를 알고 있지만 이러한 사항을 관찰 할 수없는 경우 교환 가능한 수량이 분명합니다. 계수 또는 오차 (예 : 잔차) 추정값을 대체하면 수량을 더 오래 교환 할 수 있습니다. 그러나 어떤 특정 조건 하에서 그것들은 대략 교환이 가능합니다 (일부 사람들은 이것을 정확하게 옹호합니다) .... 그렇게하면 부트 스트랩과 비슷한 것이지만 대체로 샘플링하지 않고 교체없이 샘플링으로 끝납니다.
Glen_b

감사합니다; 나는 이것을 신중하게 생각할 것입니다. 여기서 배울 점이 더 깊다고 생각합니다. :)
usεr11852는

1
@NULL 어떤 이유로 든 참조 요청이 누락되었습니다. 시작점으로 여기에 몇 가지 참고 문헌이 있습니다 : davegiles.blogspot.com/2019/04/…
Glen_b
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.