가중치가있는 Fisher의 정확한 테스트?


12

무게를 고려한 Fisher 's Exact Test의 변형을 아는 사람이 있습니까? 예를 들어 샘플링 무게 .
따라서 일반적인 2x2 크로스 테이블 대신 모든 데이터 포인트는 포인트를 측정하는 "질량"또는 "크기"값을 갖습니다.

데이터 예 :

A B weight
N N 1
N N 3
Y N 1
Y N 2
N Y 6
N Y 7
Y Y 1
Y Y 2
Y Y 3
Y Y 4

그런 다음 Fisher 's Exact Test는이 2x2 크로스 테이블을 사용합니다.

A\B  N  Y All
 N   2  2   4
 Y   2  4   6
All  4  6  10

가중치를 '실제'수의 데이터 포인트로 사용하면 다음과 같은 결과가 발생합니다.

A\B  N  Y All
 N   4 13  17
 Y   3 10  13
All  7 23  30

그러나 그것은 너무 높은 신뢰를 초래할 것입니다. N / Y에서 N / N으로 변경되는 하나의 데이터 포인트는 통계에 매우 큰 차이를 만듭니다.
또한 무게에 분수가 포함되어 있으면 작동하지 않습니다.

답변:


10

'정확한'테스트와 샘플링 가중치가 본질적으로 호환되지 않는 개념이라는 의혹이 있습니다. Stata에서 샘플 설문 조사를위한 훌륭한 시설과 정확한 테스트를위한 합리적인 시설을 확인했으며 샘플 가중치가있는 크로스 탭에 대한 8 가지 가능한 테스트 통계에는 Fisher와 같은 '정확한'테스트가 포함되어 있지 않습니다.

관련 Stata 수동 입력 ( svy : tabulate twoway )은 모든 경우에 기본 테스트를 사용하도록 권장 합니다. 이 기본 방법은 일반적인 Pearson의 카이 제곱 통계를 기반으로합니다. 인용 :

"측량 설계를 설명하기 위해 통계는 2 차 Rao and Scott (1981, 1984) 보정을 사용하여 정수가 아닌 자유도를 가진 F 통계량으로 바뀝니다."

참조 :

  • Rao, JNK 및 AJ Scott. 복잡한 표본 조사에서 범주 형 데이터 분석 : 양방향 테이블에서 적합도 및 독립성에 대한 카이 제곱 검정. 미국 통계 협회 저널 76 : 221–230.
  • Rao, JNK 및 AJ Scott. 1984. 측량 데이터로부터 추정 된 세포 비율을 갖는 다 방향 우발성 표에 대한 카이 제곱 검정. 통계 자료 12 : 46-60.

3

흥미로운 질문입니다. 체중이란 무엇입니까?

부트 스트랩을 수행하는 경향이 있습니다 ... 좋아하는 통계 (예 : Fisher 's Exact)를 선택하고 데이터로 계산하십시오. 그런 다음 귀무 가설에 따라 각 인스턴스에 새 셀을 할당하고 프로세스를 999 회 반복하십시오. 이것은 귀무 가설 하에서 검정 통계량에 대해 상당히 좋은 경험적 분포를 제공하고 p- 값을 쉽게 계산할 수있게합니다!


감사! 그러나 계산하기 더 빠르고 안정적인 통계를 원했습니다 ...
Michel de Ruiter

2

샘플 가중치에 대한 한 가지 빠른 것-일반적으로 샘플링하는 모집단에 대한 일부 정보를 통합하는 방법이지만 일반적으로 "큰 샘플"유형 시나리오 (일반적으로 위장 된 BLUP 또는 BLUE 예측)를 기반으로합니다. 따라서 샘플 무게는 무게가없는 것보다 나을 것입니다. 더 나은 방법은 샘플 디자인이 기반으로 한 모집단에 대한 정보를 사용하는 것입니다.

R1,,RkkR1;11,R1;12,R1;21,R1;22,l=1kRl;ijRl;ijrl;iji,jRl;ij=Rl(l=1,,k)

P(Dm)=1P(Dm)=0그들이 샘플에 없다면. 그러나 일반적으로 설계는 관찰 할 수있는 데이터보다 더 많은 정보를 기반으로합니다. 그러나 중요한 것은 설문 조사 디자인 자체가 아니라 정보라는 점에 유의하십시오. 설계 기반 추론은 모든 정보를 분석에 통합 할 수있는 매우 효율적인 방법입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.