순열 테스트를 사용하면 어떤 이점이 있습니까?


10

시험 통계에 의해 대체 가설에 비해 일부 널 (null)을 테스트 할 때 , 여기서 , 설정과 순열 시험 적용 에 순열의 우리는 새로운 통계가 U(X)X={xi,...,xn}GX

T(X):=#{πG:U(πX)U(X)}|G|.
  1. 순열 테스트를 사용하지 않고 사용하는 것의 이점은 무엇입니까? 즉 순열 테스트가 작동하면 어떻게 되나요?

  2. 그렇게하는 조건은 무엇입니까? 검정 통계량 및 / 또는 귀무 가설의 조건과 같은 ?U

예를 들어

  1. 한다 에 기초하여, p 값이 동일하게 샘플, ? 그렇다면 왜 그렇습니까? (참조도 감사합니다)T(X)U(X)X

    의 p- 값은 로 정의됩니다 . 순열 테스트가 U (X) 의 순열 분포를 추정하는 경우 | X = x 라면, T (X)X = x 에서 U (X) 의 p- 값과 어떻게 같 습니까? 특히 널 하나 개 이상의 분포가있을 수 HT (X)을 가지고 다음 귀무 분포 하나씩 고려하지 \ sup_ {H에서 F \}\ inf_을 {C : U (x)의 \ geq c} .U(X)

    infcR:U(x)csupFHP(U(X)c|XF)
    U(X)|X=xT(X)U(X)X=xHT(X)supFHinfc:U(x)c
  2. 순열 검정을 통해 귀무 가설을 통해 T(X) 분포가 없어야합니까? 어떤 조건이 그렇게됩니까?

  3. 한다 T(X) 균일를 통해 배포 [0,1] ? 어떤 조건이 그렇게됩니까? 알 때 U() 상수 함수이며, T() 에서도 일정한 1 및 분포 T(X) 위에 균일하게되는 거리가 멀다 [0,1] .

감사합니다.


@Glen_b : 감사합니다! 한다 에 기초하여, p 값이 동일하게 모든 시료에 대하여, ? 올바르게 이해하면 이 슬라이드의 5 페이지에서 찾았습니다. 따라서 순열 테스트 사용의 이점은 null 미만 의 분포를 모르고 원래 테스트 통계 의 p- 값을 계산하는 것 입니까? 따라서 의 분포가 반드시 균일 할 필요는 없습니까? T(X)U(X)XUXT(X)
Tim

"T는 p- 값 (큰 U가 널과의 편차를 나타내고 작은 U가 그것과 일치하는 경우" 입니까? 검정 통계량 및 표본 의 p- 값 이 입니까? UXT(X)
Tim

왜? 그것을 설명하기위한 참고 자료가 있습니까?
Tim

답변:


18

토론이 길어지면서 답변에 대한 답변을 얻었습니다. 그러나 나는 순서를 바꿨다.

순열 테스트는 점근 법이 아닌 "정확한"테스트입니다 (예를 들어, 가능성 비율 테스트와 비교). 예를 들어, 널 (null) 아래의 평균 차이 분포를 계산할 수없는 경우에도 평균 검정을 수행 할 수 있습니다. 관련된 분포를 지정할 필요조차 없습니다. 완전 모수 적 가정만큼 민감하지 않고 일련의 가정 하에서 우수한 검정력을 갖는 검정 통계량을 설계 할 수 있습니다 (강력하지만 양호한 ARE를 갖는 통계량을 사용할 수 있음).

귀하가 제공 한 정의 (또는 인용 한 사람이 제공 한 정의)는 보편적이지 않습니다. 어떤 사람들은 U를 순열 검정 통계량이라고 부릅니다 (순열 검정을 만드는 것은 통계가 아니라 p- 값을 평가하는 방법입니다). 그러나 순열 테스트를 수행하고 '이것의 극단이 H0과 일치하지 않습니다'라는 방향을 지정하면 위의 T에 대한 이러한 종류의 정의는 기본적으로 p- 값을 계산하는 방법입니다. 적어도 null (p- 값의 정의) 하에서 샘플만큼 극단적 인 순열 분포.

예를 들어, 2- 표본 t- 검정과 같은 평균에 대한 (단일, 단순성을 위해) 검정을 수행하려면 통계를 t- 통계량의 분자 또는 t- 통계 자체로 만들 수 있습니다. 또는 첫 번째 표본의 합 (각각의 정의는 다른 것에서는 단조 적이거나 결합 된 샘플에 조건부로 적용됨) 또는 그에 대한 단조 적 변환이며 동일한 p- 값을 생성하므로 동일한 테스트를 수행합니다. 샘플 통계 거짓말을 선택한 모든 통계의 순열 분포가 (비례 적으로) 얼마나 멀리 있는지 확인하기 만하면됩니다. 위에서 정의한 T는 다른 통계 일 뿐이며, 내가 선택할 수있는 다른 것만 큼 우수합니다 (U에서 단조로 정의 된 T).

연속 분포가 필요하고 T는 반드시 이산 적이므로 T는 정확히 균일하지 않습니다. U와 T는 둘 이상의 순열을 주어진 통계량에 매핑 할 수 있기 때문에 결과는 똑같지는 않지만 "균일 한"cdf **를 가지지 만 단계의 크기가 반드시 같지 않은 경우 .

** ( , 각 점프의 올바른 한계에서 엄격하게 동일-실제로 이름이있을 수 있습니다)F(x)x

이 무한대로 진행되는 합리적인 통계 의 경우, 의 분포는 균일성에 접근합니다. 이해하기 시작하는 가장 좋은 방법은 실제로 다양한 상황에서하는 것입니다. nT

샘플 X에 대해 T (X)가 U (X)를 기반으로하는 p- 값과 같아야합니까? 올바르게 이해하면이 슬라이드의 5 페이지에서 찾았습니다.

T는 p- 값입니다 (큰 U가 널과의 편차를 나타내고 작은 U가 그와 일치하는 경우). 분포는 샘플에서 조건부입니다. 따라서 분포는 '샘플'이 아닙니다.

따라서 순열 테스트를 사용하면 N 미만의 X 분포를 몰라도 원래 테스트 통계 U의 p- 값을 계산할 수 있다는 이점이 있습니까? 따라서 T (X)의 분포가 반드시 균일 할 필요는 없습니까?

나는 이미 T가 균일하지 않다고 설명했습니다.

나는 이미 순열 테스트의 이점으로 보는 것을 설명했다고 생각합니다. 다른 사람들은 다른 장점을 제안 할 것입니다 ( 예 :) .

"T는 p- 값 (큰 U가 널과의 편차를 나타내고 작은 U가 그것과 일치하는 경우)"입니까, 검정 통계량 U 및 표본 X의 p- 값이 T (X)입니까? 왜? 그것을 설명하기위한 참고 자료가 있습니까?

인용 한 문장은 T가 p- 값이고 언제인지를 명시 적으로 나타냅니다. 당신이 그것에 대해 분명하지 않은 것을 설명 할 수 있다면 더 말할 수 있습니다. 이유는 p- 값 의 정의 (링크의 첫 문장)를 참조하십시오.

순열 테스트에 대한 기본적인 기본 토론이 있습니다 .

-

편집 : 여기에 작은 순열 테스트 예제를 추가하십시오. 이 (R) 코드는 작은 샘플에만 적합합니다. 보통 샘플에서 극단적 인 조합을 찾으려면 더 나은 알고리즘이 필요합니다.

단측 대안에 대한 순열 테스트를 고려하십시오.

H0:μx=μy (일부 사람들은 *를 주장합니다 )μxμy
H1:μx<μy

* 그러나 나는 일반적으로 null 분포를 풀려고 할 때 학생들에게 문제를 혼동시키는 경향이 있기 때문에 피합니다.

다음 데이터에서 :

> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99

7 개의 관측 값을 크기 3과 4의 표본으로 나누는 35 가지 방법이 있습니다.

> choose(7,3)
[1] 35

앞에서 언급했듯이 7 개의 데이터 값이 주어지면 첫 번째 샘플의 합은 평균 차이에서 단조이므로 테스트 통계로 사용합시다. 따라서 원래 샘플의 테스트 통계량은 다음과 같습니다.

> sum(x)
[1] 64.77

이제 순열 분포는 다음과 같습니다.

> sort(apply(combn(c(x,y),3),2,sum))
 [1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07

(그들을 정렬하는 것이 필수적은 아닙니다. 테스트 통계가 끝에서 두 번째 값이라는 것을 더 쉽게 볼 수 있도록하기 위해 방금했습니다.)

가 2/35 임을 (이 경우 검사로) 볼 수 있습니다 . 또는p

> 2/35
[1] 0.05714286

(xy 오버랩이없는 경우에만 p- 값이 .05 미만일 수 있습니다.이 경우 묶인 값이 없으므로 는 불 연속적 입니다.)TU

순열 분포

분홍색 화살표는 x 축의 표본 통계량과 y 축의 p- 값을 나타냅니다.


감사! 그래서 본질적으로, 순열 테스트의 분포 추정하는 데 사용되는 의 널 분배에서 , 그렇지? 그래서 의 널 분포에 따라 ,하지만, p- 값은 모두 널 (null) 배포판을 통해 FP 속도의 INF 인 및 위한 P-값 와 ? U(X)XT(X)XXT(X)UX
Tim

의 순열 분포를 추정합니다 . 모든 순열을 동일하게 처리하여 '널 미만'으로 만드는 것은 사실입니다 (널 아래에 순열이 동일하게 있어야 함). U(X)|X=x
Glen_b-복지 주 모니카

(1) )의 p- 값은 로 정의됩니다 . 순열 테스트가 의 순열 분포를 추정하는 경우 라면, 는 에서 의 p- 값과 어떻게 같 습니까? 특히 널 하나 개 이상의 분포가있을 수 와 가지고 다음 귀무 분포 하나씩 고려하지 와 . (2) 는 모든 널 분포에 대해 같은 분포를 가지고 있습니까? U(X)
infcR:U(x)csupFHP(U(X)c|XF)
U(X)|X=xT(X)U(X)X=xHT(X)supFHinfc:U(x)cT(X)
Tim

(1)에 추가 된 순열 테스트는 단순한 널뿐만 아니라 복합 널에도 적용됩니까?
Tim

(1) 어디에 정의되어 있습니까? 그것은 이상한 정의처럼 보입니다. X 분포를 왜 지정 하시겠습니까? 당신은 에서 조절하고 있습니다. 당신의 혼란은 다소 이상한 정의에서 비롯된 것 같습니다. (2) 전혀 이해가되지 않습니다. X=x
Glen_b-복지 주 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.