Fisher의 정확한 검정에서 검정 통계량은 무엇입니까?


9

2x2 비상 대표의 경우 일부 피셔의 정확한 테스트 에서는X1,1 표의 (1,1) 셀에서 검정 통계량으로, 귀무 가설 하에서, X1,1 초기 하 분포를 갖게됩니다.

일부는 테스트 통계가

|X1,1μ|
어디 μ널 (null) 하에서의 초기 하 분포 (평균)의 평균입니다. 또한 p- 값은 초고도 분포의 표를 기반으로 결정된다고 말했다. 평균을 빼고 절대 가치를 가져야 할 이유가 있는지 궁금합니다.|X1,1μ| null 하에서 초기 하 분포가 없는가?

답변:


10

(우리의 개념을 좀 더 정확하게하기 위해, 실제로 p- 값을 계산하기 위해 찾은 것의 분포를 '테스트 통계'라고 부릅니다. 이것은 양측 t- 검정의 경우, 테스트 통계는 |T| 오히려 T.)

테스트 통계 샘플 공간에 순서를 지정하여 (또는 더 엄격하게는 부분 순서에 따라) 극단적 인 경우 (대안과 가장 일치하는 경우)를 식별 할 수 있습니다.

Fisher의 정확한 테스트의 경우 이미 2x2 테이블 자체의 확률 인 순서가 있습니다. 그것이 일어날 때, 그들은 주문에 해당합니다X1,1 가장 큰 값이든 가장 작은 값이든 X1,1'극단적'이며 또한 확률이 가장 작은 것들입니다. 따라서 가치를 보지 말고X1,1 당신이 제안하는 방식으로, 각 단계에서 크고 작은 끝에서 단순히 일할 수 있습니다 (가장 큰 값이든 가장 작은 값이든) X1,1-값이 아직 존재하지 않음)는 관측 된 테이블에 도달 할 때까지 계속 진행될 확률이 가장 작습니다. 포함시 모든 극단 테이블의 총 확률은 p- 값입니다.

예를 들면 다음과 같습니다.

초기 하 확률 함수

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

첫 번째 열은 X1,1 값에서 두 번째 열은 확률이고 세 번째 열은 유도 된 순서입니다.

따라서 Fisher 정확한 테스트의 특정 경우 각 테이블의 확률 (각각의 확률)X1,1value)는 실제 검정 통계량으로 간주 될 수 있습니다 .

제안 된 검정 통계량을 비교하면 |X1,1μ|이 경우 통계의 값이 클수록 확률의 값이 작으므로 '통계'로 간주 될 수 있으므로이 경우 동일한 순서를 유도합니다. -그러나 다른 많은 수량도 가능할 수 있습니다.X1,1모든 경우에 항상 동일한 p- 값을 생성하기 때문에 동등한 테스트 통계입니다.

또한 시작시 도입 된 '통계량'에 대한보다 정확한 개념으로 인해이 문제에 대한 가능한 검정 통계량 중 실제로 초 지오메트리 분포가 없습니다. X1,1하지만 실제로는 양측 검정에 적합한 검정 통계량이 아닙니다 (만약 우리가 주 대각선에서 두 번째 대각선이 아닌 더 많은 연관성 만 대안과 일치하는 것으로 간주되는 단측 검정을 수행 한 경우에는 다음과 같습니다. 테스트 통계). 이것은 내가 시작한 것과 동일한 단발 / 양발 문제입니다.

[편집 : 일부 프로그램은 Fisher 테스트에 대한 테스트 통계를 제공합니다. 나는 이것이 -2logL 타입 계산이라고 가정하고 카이 제곱과 무조건 비교할 수 있다고 가정했다. 일부는 승산 비 또는 로그를 표시 할 수도 있지만 그다지 동등하지는 않습니다.]


고마워요, Glen_b! 의 분포X1,1 널 (null) 아래에는 초기 하 분포가 평균 주위에 대칭이 아닙니다. μ. 그래서 궁금합니다|X1,1μ|합리적인 검정 통계량입니까?
Tim

완전히 해석 가능하고 쉽게 이해할 수 있기 때문에 상당히 합리적인 검정 통계량 인 것 같습니다. 실제로 가능한 통계 중 어느 것도 대칭 분포를 갖지 않습니다. 피셔 테스트의 세부 사항을 잠시 잊어 봅시다. 통계가 의미가있는 경우 (초 기하학적 계산을 사용하여 확률을 찾는) 정확한 기준을 계산할 수 있습니다. 모든 경우에 동일한 순서를 유도하고 있음을 나타내려면 아마도 새로운 질문 일 것입니다.
Glen_b-복지 주 모니카

6

|X1,1μ| 일반적으로 초기 하 분포를 가질 수 없습니다. μ 정수 값일 필요는 없습니다. |X1,1μ|정수가 아닙니다. 그러나 조건 적으로 여백에X1,1 초기 하 분포를 갖게됩니다.

올바르게 수행하고 여백을 알려진 값으로 고정하면 고려할 수 있습니다. X1,1(또는 다른 셀) 통계로 사용합니다. 그림의 비유로k 항아리에서 공을 포함 W 하얀 공 B 보충없는 까만 공, X1,1 흰색 공의 수로 해석 할 수 있습니다. B 첫 번째 행의 합입니다. W 두 번째 행의 합입니다. k 첫 번째 열의 합입니다.


4

실제로 하나는 없습니다. 검정 통계량은 역사적 변칙입니다. 검정 통계량을 갖는 유일한 이유는 p- 값에 도달하는 것입니다. Fisher의 정확한 검정은 검정 통계량을 뛰어 넘어 p- 값으로 바로 이동합니다.


고맙지 만 테스트 통계가 실제로 없습니까? 그러면 p 값을 어떻게 결정합니까?
Tim

Fisher의 정확한 검정 결과는 p- 값입니다.
Jeremy Miles

@JeremyMiles : 저비용 컴퓨팅 이전에 사용자가 Z, t 등을 계산 한 다음이 테스트 통계를 사전 계산 된 테이블과 비교하여 통계적 유의성을 결정하고 결과적으로 테스트 통계가 역사적 이상임을 의미합니까? 현재 많은 추론 통계 사용자는 p- 값을 쉽게 제공 할 수있을 때 여전히 테스트 통계의 관점에서 생각합니까? 다시 말해, 이것은 일종의 세대 효과입니까?
rabidotter

1
@rabidotter-예, 그렇습니다. "F = 14.352, df = 2, 568, p <0.05"라고 쓴 사람들이 있습니다. 누군가가 F에 관심을 갖는 유일한 이유는 P를 계산하는 것이지만, F를 엄청나게 정밀하게하고 p를 아주 작은 정밀도로 내립니다.
Jeremy Miles
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.