R의 피셔 테스트


11

다음과 같은 데이터 세트가 있다고 가정하십시오.

                Men    Women    
Dieting         10      30
Non-dieting     5       60

R에서 Fisher 정확한 테스트를 실행하면 무엇을 alternative = greater의미합니까? 예를 들면 다음과 같습니다.

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

내가 얻을 p-value = 0.01588하고 odds ratio = 3.943534. 또한 우발 사태 테이블의 행을 다음과 같이 뒤집을 때 :

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

그때는 얻을 p-value = 0.9967하고 odds ratio = 0.2535796. 그러나 대체 인수 (예 :)없이 두 비상 테이블을 실행하면을 fisher.test(mat)얻습니다 p-value = 0.02063.

  1. 나에게 이유를 설명해 주시겠습니까?
  2. 또한 위의 경우 귀무 가설과 대립 가설은 무엇입니까?
  3. 다음과 같은 우발 상황 테이블에서 피셔 테스트를 실행할 수 있습니까?

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

추신 : 저는 통계학자가 아닙니다. 귀하의 도움 (간단한 영어로 답변)이 높이 평가되도록 통계를 배우려고합니다.

답변:


11

greater(또는 less)는 귀무 가설을 p1=p2대안 p1>p2(또는 p1<p2) 과 비교하는 단측 검정을 나타냅니다 . 대조적으로, 양측 검정은 귀무 가설을 p1같지 않은 대안 과 비교합니다 p2.

표의 경우, 남성의 다이어트 비율은 샘플에서 1/4 = 0.25 (40 개 중 10 개)입니다. 반면, 수컷이 아닌 비식이자의 비율은 샘플에서 1/13 또는 (65 중 5) 0.077과 같습니다. 따라서 추정치 p1는 0.25이고 추정치 p2는 0.077입니다. 따라서 나타납니다 p1>p2.

따라서 단측 대안의 p1>p2경우 p- 값이 0.01588입니다. (작은 p- 값은 귀무 가설이 거의없고 대안이 가능하다는 것을 나타냅니다.)

대안이 될 때 p1<p2귀하의 데이터가 그 차이가 잘못된 (또는 예상치 못한) 방향임을 나타냅니다.

그렇기 때문에 p- 값이 0.9967로 너무 높습니다. 양면 대안의 경우 p- 값이 단면 대안의 경우보다 약간 높아야 p1>p2합니다. 실제로 p- 값이 0.02063입니다.


1
환상적인 설명. 따라서 피셔 정확한 테스트는 실제로 열이 아닌 행 간 확률을 비교합니까?
Christian

@Christian : 아니요, 피셔 테스트의 행 또는 열이 우발성 테이블에서 상관 관계를 검사하는지 여부는 중요하지 않습니다. 행과 열은 직접적으로 중요하지 않습니다. 당신은 또한 가설을 재구성 할 수도 있습니다. 대신에 H0가 "흡연하는 사람들이 더 어리게 죽는 사람들"이라고 가정 할 수도 있습니다. 피셔 테스트의 결과는 데이터에서 관찰 된 연결이 귀무 가설을 지원하는지 여부를 알려 주지만, 독립 변수 또는 종속 변수가 무엇인지는 중요하지 않으며 행 / 열의 선택도 중요하지 않습니다. )
Dominique Paul
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.