비상 사태 표 : 어떤 테스트를 언제 언제해야합니까?


17

나는의 확장보고 싶은 이 논의 범위를 조금 확대, 오래된 카이 제곱 대 피셔의 정확한 테스트 논쟁을. 우발 사고 테이블에는 상호 작용에 대한 많은 테스트가있어서 머리를 돌리기에 충분합니다. 어떤 테스트를 언제 사용해야하는지에 대한 설명과 한 테스트가 다른 테스트보다 선호되어야하는 이유에 대한 설명을 얻고 싶습니다.

내 현재의 문제는 고전적인 사례이지만 적어도 진행 방법이 분명하지 않은 경우 R에서 다양한 솔루션을 구현하기위한 팁과 같이 더 높은 차원에 대한 답변을 환영합니다.n×미디엄

아래에 내가 아는 모든 테스트가 나열되어 있습니다. 내 오류를 수정하여 수정할 수 있기를 바랍니다.

  • . 이전 대기 여기에는 세 가지 주요 옵션이 있습니다.χ2

    • 2x2 테이블에 대해 R에 내장 된 수정 사항 : "반이 모든 차이 에서 뺍니다 ." 나는 항상 이것을해야합니까?|OE|
    • " " χ 2 테스트, R에서이 작업을 수행하는 방법을 잘 모르겠습니다.N1χ2
    • 몬테카를로 시뮬레이션. 이것이 항상 최고입니까? 내가 이것을 할 때 R이 왜 df를 제공하지 않습니까?
  • 피셔의 정확한 테스트 .

    • 어떤 셀이 4보다 작을 것으로 예상되면 전통적으로 조언을 받았지만 분명히 일부 조언에 이의가 있습니다.
    • 한계 값이 고정되었다고 가정하는 (보통 거짓) 가정이 실제로이 테스트에서 가장 큰 문제입니까?
  • 버나드의 정확한 시험

    • 내가 들어 본 적이없는 다른 정확한 테스트.
  • 포아송 회귀

    • glms에 대해 항상 혼란스러워하는 한 가지는이 중요성 테스트를 수행하는 방법과 정확히 일치하므로 도움이 될 것입니다. 중첩 모델 비교를 수행하는 것이 가장 좋습니까? 특정 예측 변수에 대한 Wald 검정은 어떻습니까?
    • 정말 항상 포아송 회귀 분석을 수행해야합니까? 이 시험 과 시험 의 실제 차이점은 무엇입니까 ?χ2

답변:


13

좋은 질문이지만 큰 질문입니다. 나는 완전한 답을 줄 수는 없다고 생각하지만 생각할만한 음식을 버리겠다.

먼저, 맨 위의 글 머리 기호 아래에서 참조하는 수정을 Yates의 연속성 수정 이라고 합니다 . 문제는 불연속 추론 통계량을 계산한다는 것입니다 .
(우연성 표에 유한 한 수의 인스턴스 만 표시되므로이 통계가 취할 수있는 유한 한 수의 실현 가능한 값이 있기 때문에 불연속적입니다.)이 사실에도 불구하고, 이는연속참조 분포와 비교됩니다(,자유도(r-1)를갖는χ2분포(c-1

χ2=(영형이자형)2이자형

χ2 ). 이것은 반드시 어떤 수준에서 불일치로 이어집니다. 특히 작은 데이터 세트의 경우 일부 셀의 예상 값이 5보다 작 으면 p- 값이 너무 작을 수 있습니다. 예이츠의 수정이 이에 맞게 조정됩니다. (아르 자형1)(1)

아이러니하게도 동일한 근본적인 문제 (불연속 불일치)가 p- 값이 너무 높을 수 있습니다. 구체적으로 p- 값은 일반적 으로 극단적이거나 그 이상인 데이터를 얻을 확률로 정의됩니다.관찰 된 데이터보다. 지속적인 데이터를 사용하면 정확한 값을 얻을 확률이 거의 없기 때문에 데이터의 확률이 훨씬 더 높아집니다. 그러나 이산 데이터를 사용하면 자신과 마찬가지로 데이터를 얻을 가능성이 유한합니다. 데이터를 사용자보다 더 극단적으로 얻을 확률 만 계산하면 공칭 p- 값이 너무 낮아 (타입 I 오류 증가), 데이터를 사용자와 동일하게 얻을 확률을 포함하면 공칭 p- 값이 너무 높아집니다 (이로 인해 유형 II 오류가 증가합니다). 이러한 사실은 p- 값 중간 . 이 접근법에서 p- 값은 데이터보다 절반이 더 많을 확률이 절반입니다 데이터 확률은 귀하와 동일합니다.

지적했듯이 우발 사태 테이블 데이터를 테스트 할 가능성은 많습니다. 다양한 접근 방식의 장단점을 가장 포괄적으로 다루는 것은 여기에 있습니다 . 이 백서는 2x2 테이블에만 적용되지만 비상 테이블 데이터를 읽어 옵션을 통해 많은 정보를 얻을 수 있습니다.

또한 모델을 진지하게 고려할 가치가 있다고 생각합니다. 카이 제곱과 같은 오래된 테스트는 많은 사람들이 빠르고 쉽고 이해하기 쉬우나 적절한 모델을 구축 할 때 얻을 수있는 데이터에 대한 포괄적 인 이해를 제공하지는 않습니다. 우발성 테이블의 행 [열]을 반응 변수로 생각하고 열 [행]을 설명 / 예측 변수로 생각하는 것이 합리적이라면 모델링 방법은 아주 쉽게 따릅니다. 예를 들어, 행이 두 개인 경우 로지스틱 회귀 분석 모델을 . 여러 열이있는 경우 참조 셀 코딩 (더미 코딩)을 사용하여 ANOVA 유형 모델을 작성할 수 있습니다. 반면에 행이 두 개 이상인 경우 다항 로지스틱 회귀 을 동일한 방식으로 사용할 수 있습니다. 행에 본질적인 순서, 순서 로지스틱 회귀 분석이있는 경우 는 다항식보다 우수한 성능을 제공합니다. 로그 선형 모델 (Poisson regression)은 내 생각에 2 차원 이상의 우발성 테이블이 없다면 적절하지 않을 것입니다.

이와 같은 주제를 종합적으로 다루기 위해 가장 좋은 출처는 Agresti의 저서입니다. 그의 본격적인 대우 (보다 엄격한), 서적 서적 (더 쉽지만 여전히 포괄적이며 매우 좋음) 또는 서수 서적 입니다.

2-테스트

2=영형ln(영형이자형)


1
그것은 근본적인 문제에 대한 훌륭한 설명이었습니다. 감사합니다! 또한 과거에는 Agresti의 텍스트가 훌륭한 자료라고 들었습니다. 그래서 확인해 보겠습니다.
JVMcDonnell

4

본인의 관점에서 최대한 귀하의 질문 중 일부를 해결하려고 노력할 것입니다. 먼저 Fisher-Irwin Test는 Fisher의 정확한 테스트의 또 다른 이름입니다. 때로는 계산적으로 강렬하다는 사실을 제외하고는 일반적으로 Fisher 테스트를 사용하는 것을 선호합니다. 이 테스트에 문제가있는 경우 한계 총계에 대한 조정입니다. 이 테스트의 장점은 귀무 가설 하에서 관측 된 테이블과 동일한 한계 계수를 갖는 우발성 테이블 세트에 초기 하 분포가 있다는 것입니다. 일부 사람들은 동일한 총계가있는 테이블에 대한 고려를 제한한다는 이론적 근거를 보지 못한다고 주장합니다.

Pearson의 카이 제곱 검정은 우발성 표의 연관성을 검정하는 데 매우 일반적으로 사용됩니다. 다른 많은 테스트와 마찬가지로 근사치이므로 유의 수준이 항상 정확한 것은 아닙니다. Cochran은 일부 세포가 매우 드문 경우 (예 : 일부 세포에서 5 개 미만의 경우를 포함) 작은 표본에서 근사치가 나쁘다는 것을 보여주었습니다.

다른 많은 대략적인 테스트가 있습니다. 일반적으로 SAS를 사용하여 Fisher의 테스트를 적용 할 때 이러한 모든 테스트에서 결과를 얻으며 일반적으로 거의 동일한 결과를 제공합니다. 그러나 Fisher의 검정은 항상 한계 총계에 대한 정확한 조건입니다.

포아송 회귀와 관련하여 범주 형 변수를 셀 총계와 관련시키는 모형입니다. 다른 모델과 마찬가지로 일련의 가정에 의존합니다. 가장 중요한 것은 셀 개수가 포아송 분포를 따르는 것입니다. 즉, 평균 개수는 분산과 같습니다. 일반적으로 셀 수 분포에는 해당되지 않습니다. 과대 산포 (평균보다 큰 분산)의 경우 음 이항 모델이 더 적합 할 수 있습니다.


이 수, 아하 ... "피셔 - 어윈 테스트는 피셔의 정확한 테스트를위한 또 다른 이름입니다" 이 댓글 , 나에게 혼란을 덜 감사합니다!
JVMcDonnell

3
당신의 대답은 이러한 일을 언제 해야하는지에 대한 혼란을 실제로 줄이지 않았습니다. 내가 듣고 싶어했던 것 중 하나는 몬테 카를로 시뮬레이션이나 수정 등에 의해 chi ^ 2의 문제를 어느 정도 해결할 수 있을지 모른다. 또는 glm에 의해 대체 될 수있는 정도. 그래서 나는 더 많은 물기를 얻을 수 있는지 알기 위해 이것을 열어 두겠습니다. 그러나 조금 후에 아무도 무게를 no 지 않으면 나는 당신의 대답을 받아 들일 것입니다.
JVMcDonnell

Fisher와 Chi-square의 경우 chi square를 사용할 수 있다고 말한 것 같습니다. 항상 한계 총계를 조정해야한다는 Fisher의 아이디어를 수락하면 Fisher의 테스트가 항상 적용됩니다. 그러나 당신이 그것을 받아들이지 않으면 무조건 테스트를 선택해야 할 것 같아요. 사용 가능한 다른 테스트 배터리에 관해서는 속성에 대해 아무것도 몰라서 사용 시점을 실제로 조언 할 수는 없습니다. 양식 경험 결과가 대개 밀접하게 일치하기 때문에 중요한 경우를 보았습니다.
Michael R. Chernick

Fisher가 "항상 총계를 항상 조절해야한다"고 생각한 것이 사실입니까? 이 가정은 한계 총계가 고정 된 경우에만 유효합니다. 레이디 시음 차 예제에서, 레이디는 5는 우유 우선이고 5는 우유 마지막임을 알고 있습니다. 그러나 실험에서 한계를 강제하는 힘이없는 것이 더 일반적입니다. 동전 두 개를 각각 10 번 뒤집는 경우를 생각해보십시오. 동전 주위에 5 개의 머리가 감겨도 가장자리를 유지하기 위해 꼬리가 나오지 않습니다. 그러한 경우 Fisher 's는 매우 보수적 인 것으로 기록되어 있습니다. 그래서 대안에 관심이 있습니다.
JVMcDonnell

예. Fisher가 주어진 데이터의 정보를 사용하는 참조 분포를 선택한다고 믿었습니다. 따라서 그는 총합이 관측 된 데이터를 어떻게 얻었 든 상관없이 데이터에 대한 제약 조건, 즉 주어진 한계 총계를 따르는 귀무 가설 하에서 발생한 데이터와 비교해야한다고 생각합니다. Fisher가 가지고있는 다른 아이디어와 마찬가지로 논쟁의 여지가있었습니다.
Michael R. Chernick
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.