토론이 길어지면서 답변에 대한 답변을 얻었습니다. 그러나 나는 순서를 바꿨다.
순열 테스트는 점근 법이 아닌 "정확한"테스트입니다 (예를 들어, 가능성 비율 테스트와 비교). 예를 들어, 널 (null) 아래의 평균 차이 분포를 계산할 수없는 경우에도 평균 검정을 수행 할 수 있습니다. 관련된 분포를 지정할 필요조차 없습니다. 완전 모수 적 가정만큼 민감하지 않고 일련의 가정 하에서 우수한 검정력을 갖는 검정 통계량을 설계 할 수 있습니다 (강력하지만 양호한 ARE를 갖는 통계량을 사용할 수 있음).
귀하가 제공 한 정의 (또는 인용 한 사람이 제공 한 정의)는 보편적이지 않습니다. 어떤 사람들은 U를 순열 검정 통계량이라고 부릅니다 (순열 검정을 만드는 것은 통계가 아니라 p- 값을 평가하는 방법입니다). 그러나 순열 테스트를 수행하고 '이것의 극단이 H0과 일치하지 않습니다'라는 방향을 지정하면 위의 T에 대한 이러한 종류의 정의는 기본적으로 p- 값을 계산하는 방법입니다. 적어도 null (p- 값의 정의) 하에서 샘플만큼 극단적 인 순열 분포.
예를 들어, 2- 표본 t- 검정과 같은 평균에 대한 (단일, 단순성을 위해) 검정을 수행하려면 통계를 t- 통계량의 분자 또는 t- 통계 자체로 만들 수 있습니다. 또는 첫 번째 표본의 합 (각각의 정의는 다른 것에서는 단조 적이거나 결합 된 샘플에 조건부로 적용됨) 또는 그에 대한 단조 적 변환이며 동일한 p- 값을 생성하므로 동일한 테스트를 수행합니다. 샘플 통계 거짓말을 선택한 모든 통계의 순열 분포가 (비례 적으로) 얼마나 멀리 있는지 확인하기 만하면됩니다. 위에서 정의한 T는 다른 통계 일 뿐이며, 내가 선택할 수있는 다른 것만 큼 우수합니다 (U에서 단조로 정의 된 T).
연속 분포가 필요하고 T는 반드시 이산 적이므로 T는 정확히 균일하지 않습니다. U와 T는 둘 이상의 순열을 주어진 통계량에 매핑 할 수 있기 때문에 결과는 똑같지는 않지만 "균일 한"cdf **를 가지지 만 단계의 크기가 반드시 같지 않은 경우 .
** ( , 각 점프의 올바른 한계에서 엄격하게 동일-실제로 이름이있을 수 있습니다)F(x)≤x
이 무한대로 진행되는 합리적인 통계 의 경우, 의 분포는 균일성에 접근합니다. 이해하기 시작하는 가장 좋은 방법은 실제로 다양한 상황에서하는 것입니다. nT
샘플 X에 대해 T (X)가 U (X)를 기반으로하는 p- 값과 같아야합니까? 올바르게 이해하면이 슬라이드의 5 페이지에서 찾았습니다.
T는 p- 값입니다 (큰 U가 널과의 편차를 나타내고 작은 U가 그와 일치하는 경우). 분포는 샘플에서 조건부입니다. 따라서 분포는 '샘플'이 아닙니다.
따라서 순열 테스트를 사용하면 N 미만의 X 분포를 몰라도 원래 테스트 통계 U의 p- 값을 계산할 수 있다는 이점이 있습니까? 따라서 T (X)의 분포가 반드시 균일 할 필요는 없습니까?
나는 이미 T가 균일하지 않다고 설명했습니다.
나는 이미 순열 테스트의 이점으로 보는 것을 설명했다고 생각합니다. 다른 사람들은 다른 장점을 제안 할 것입니다 ( 예 :) .
"T는 p- 값 (큰 U가 널과의 편차를 나타내고 작은 U가 그것과 일치하는 경우)"입니까, 검정 통계량 U 및 표본 X의 p- 값이 T (X)입니까? 왜? 그것을 설명하기위한 참고 자료가 있습니까?
인용 한 문장은 T가 p- 값이고 언제인지를 명시 적으로 나타냅니다. 당신이 그것에 대해 분명하지 않은 것을 설명 할 수 있다면 더 말할 수 있습니다. 이유는 p- 값 의 정의 (링크의 첫 문장)를 참조하십시오.
순열 테스트에 대한 기본적인 기본 토론이 있습니다 .
-
편집 : 여기에 작은 순열 테스트 예제를 추가하십시오. 이 (R) 코드는 작은 샘플에만 적합합니다. 보통 샘플에서 극단적 인 조합을 찾으려면 더 나은 알고리즘이 필요합니다.
단측 대안에 대한 순열 테스트를 고려하십시오.
H0:μx=μy (일부 사람들은 *를 주장합니다 )μx≥μy
H1:μx<μy
* 그러나 나는 일반적으로 null 분포를 풀려고 할 때 학생들에게 문제를 혼동시키는 경향이 있기 때문에 피합니다.
다음 데이터에서 :
> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99
7 개의 관측 값을 크기 3과 4의 표본으로 나누는 35 가지 방법이 있습니다.
> choose(7,3)
[1] 35
앞에서 언급했듯이 7 개의 데이터 값이 주어지면 첫 번째 샘플의 합은 평균 차이에서 단조이므로 테스트 통계로 사용합시다. 따라서 원래 샘플의 테스트 통계량은 다음과 같습니다.
> sum(x)
[1] 64.77
이제 순열 분포는 다음과 같습니다.
> sort(apply(combn(c(x,y),3),2,sum))
[1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07
(그들을 정렬하는 것이 필수적은 아닙니다. 테스트 통계가 끝에서 두 번째 값이라는 것을 더 쉽게 볼 수 있도록하기 위해 방금했습니다.)
가 2/35 임을 (이 경우 검사로) 볼 수 있습니다 . 또는p
> 2/35
[1] 0.05714286
(xy 오버랩이없는 경우에만 p- 값이 .05 미만일 수 있습니다.이 경우 묶인 값이 없으므로 는 불 연속적 입니다.)TU
분홍색 화살표는 x 축의 표본 통계량과 y 축의 p- 값을 나타냅니다.