부트 스트래핑, 순열 테스트, 잭나이프 등과 같이 실제로 자주 사용되는 몇 가지 널리 사용되는 리샘플링 기술이 있습니다. 필립 I 굿 (2010) 순열, 매개 변수 및 부트 스트랩 테스트와 같은 많은 기사와 서적에서 이러한 기술에 대해 설명합니다. 가설
내 질문은 어떤 리샘플링 기술이 더 인기를 얻고 구현하기가 더 쉽습니까? 부트 스트랩 또는 순열 테스트?
부트 스트래핑, 순열 테스트, 잭나이프 등과 같이 실제로 자주 사용되는 몇 가지 널리 사용되는 리샘플링 기술이 있습니다. 필립 I 굿 (2010) 순열, 매개 변수 및 부트 스트랩 테스트와 같은 많은 기사와 서적에서 이러한 기술에 대해 설명합니다. 가설
내 질문은 어떤 리샘플링 기술이 더 인기를 얻고 구현하기가 더 쉽습니까? 부트 스트랩 또는 순열 테스트?
답변:
둘 다 대중적이고 유용하지만 주로 다른 용도로 사용됩니다. 순열 검정은 가설 검정에 가장 적합하며 부트 스트랩은 신뢰 구간 추정에 가장 적합합니다.
순열 테스트는 교환 가능성에 대한 특정 귀무 가설을 테스트합니다. 즉, 랜덤 샘플링 / 랜덤 화만이 보이는 차이를 설명합니다. 이것은 t- 검정 및 분산 분석과 같은 일반적인 경우입니다. 또한 시계열 (일련 상관 관계가 없다는 귀무 가설) 또는 회귀 (관계가없는 귀무 가설)와 같은 것으로 확장 될 수 있습니다. 순열 테스트를 사용하여 신뢰 구간을 만들 수 있지만 합리적이거나 합리적이지 않은 더 많은 가정이 필요합니다 (따라서 다른 방법이 선호 됨). Mann-Whitney / Wilcoxon 검정은 실제로 순열 검정의 특별한 경우이므로 일부는 인식하는 것보다 훨씬 인기가 있습니다.
부트 스트랩은 샘플링 프로세스의 변동성을 추정하고 신뢰 구간을 추정하는 데 효과적입니다. 이 방법으로 가설 검정을 수행 할 수 있지만 순열 검정 가정이 유지되는 경우 순열 검정보다 강력하지 않은 경향이 있습니다.
R을 사용하는 경우 모두 쉽게 구현할 수 있습니다. 예를 들어 http://www.burns-stat.com/pages/Tutor/bootstrap_resampling.html을 참조하십시오.
세 번째 주요 기술이 있습니다 : 교차 검증. 모델의 예측력을 테스트하는 데 사용됩니다.
내 질문은 어떤 리샘플링 기술이
부트 스트래핑 또는 순열 테스트 중 더 인기를 얻었 습니까?
부트 스트랩은 주로 큰 표본 표준 오류 또는 신뢰 구간 생성에 관한 것입니다. 이름에서 알 수 있듯이 순열 테스트는 주로 테스트에 관한 것입니다. (각각 다른 작업에 사용되도록 조정할 수 있습니다.)
우리는 어떻게 인기를 판단합니까? 심리학과 교육과 같은 분야를 살펴보면 Wilcoxon-Mann-Whitney, 서명 된 순위 테스트, 순위 상관 테스트 등과 같은 순위 기반 테스트를 많이 사용할 수 있습니다. 이것들은 모두 순열 테스트입니다. 반면에 원본 데이터의 순열 테스트를 대신 사용할 수 있지만 일반적으로 사용되지 않는 경우가 많습니다. 일부 다른 응용 분야에서는 순열 테스트가 거의 사용되지 않지만 응용 분야에 따라 다양한 인기가 유용성보다 지역 문화에 대해 더 많은 경우가 있습니다.
쉽게 구현할 수 있습니까?
많은 경우에, 특히 간단한 것들이 거의 똑같이 쉽습니다. 이는 교체를 통한 샘플링과 교체없는 샘플링의 차이입니다.
좀 더 복잡한 경우 부트 스트랩은 (테스트 관점에서 보았을 때) null 대신 다른 방식으로 작동하기 때문에 (적어도 순진한 구현은-제대로 작동하도록하기 때문에) 부트 스트랩이 더 쉽습니다. 훨씬 더 복잡 할 수 있습니다).
보다 복잡한 경우에는 적절한 교환 가능한 수량을 관찰 할 수 없기 때문에 정확한 순열 테스트가 어려울 수 있습니다. 종종 거의 교환 가능한 수량이 정확한 가격으로 대체 될 수 있습니다 (정확하게 분배되지 않음).
부트 스트랩은 기본적으로 처음부터 해당 정확도 기준 (정확한 간격 적용 범위)을 포기하는 대신 큰 샘플에서 합리적으로 좋은 적용 범위를 얻는 데 중점을 둡니다 (때로는 이해되지 않을 수도 있지만 성공하지 못한 경우도 있습니다). 부트 스트랩이 예상 범위를 제공한다고 가정하지 마십시오).
순열 테스트는 작은 샘플에서 작동 할 수 있습니다 (심지어 제한된 수준의 선택은 때때로 매우 작은 샘플에서 문제가 될 수 있음). 반면 부트 스트랩은 큰 샘플 기술입니다 (작은 샘플과 함께 사용하는 경우 결과가 그렇지 않을 수 있음) 매우 유용합니다).
나는 그것들을 같은 문제에 대해 경쟁자로 간주하는 경우가 거의 없으며 (다른) 실제 문제에 사용했습니다.
두 가지 모두에 이점이 있지만 파나 카아에는 없습니다. 이 중 하나에 만 집중하여 학습 노력을 줄이려면 실망 할 것입니다. 둘 다 리샘플링 도구 상자의 필수 요소입니다.