nxm 비상 테이블에 대한 통계 테스트


12

세 그룹의 요소로 구성된 데이터 집합이 있습니다. G1, G2 및 G3이라고합니다. 이러한 요소의 특정 특성을 분석하고이를 3 가지 유형의 "행동"T1, T2 및 T3으로 나누었습니다 (클러스터 분석을 사용하여 수행).

이제 세 그룹의 요소 수를 유형별로 나눈 다음과 같은 3 x 3 비 상표가 있습니다.

      |    T1   |    T2   |    T3   |
------+---------+---------+---------+---
  G1  |   18    |   15    |   65    | 
------+---------+---------+---------+---
  G2  |   20    |   10    |   70    |
------+---------+---------+---------+---
  G3  |   15    |   55    |   30    |

이제 R에서이 데이터에 대해 Fisher 테스트를 실행할 수 있습니다.

data <- matrix(c(18, 20, 15, 15, 10, 55, 65, 70, 30), nrow=3)
fisher.test(data)

그리고 나는 얻는다

   Fisher's Exact Test for Count Data

data:  data 
p-value = 9.028e-13
alternative hypothesis: two.sided     

그래서 내 질문은 :

  • 이런 식으로 Fisher 테스트를 사용하는 것이 맞습니까?

  • 누가 다른 사람인지 어떻게 알 수 있습니까? 사용할 수있는 사후 테스트가 있습니까? 데이터를 보면 세 번째 그룹이 처음 두 그룹과 다른 행동을 한다고 말할 수 있습니다. 어떻게 통계적으로 표시합니까?

  • 누군가가 모델을 로짓하도록 지시했습니다.이 유형의 분석에 적합한 옵션입니까?

  • 이 유형의 데이터를 분석하는 다른 옵션이 있습니까?

정말 고마워

니코

답변:


13

처음에는 Fisher 테스트가 올바르게 사용되었다고 생각합니다.

계수 데이터는 로그 선형 모델 (로짓이 아님)을 사용하여보다 잘 처리됩니다 (적합한 값이 아래에 묶 이도록 보장합니다). R에서 family=poisson(오류 = 포아송 및 링크 = 로그를 설정)를 지정할 수 있습니다 . 로그 링크는 모든 적합치가 양수임을 확인하는 반면, 포아송 오차는 데이터가 정수이고 평균과 동일한 분산이 있다는 사실을 고려합니다. 예를 들어 glm(y~x,poisson), 모델에는 로그 링크와 포아송 오류가 있습니다 (비정규 성을 설명하기 위해).

quasipoisson오차 계열로 사용 하는 대신 과분 산이있는 경우 (잔류 편차가 푸 아송 오차 가정이 적절한 경우 잔차 자유 도와 동일해야 함) 마이너스 이항 모형에 적합 할 수 있습니다. (여기에는 glm.nb패키지 의 기능이 포함 됩니다 MASS)

귀하의 경우 다음과 같은 명령을 사용하여 모델을 맞추고 비교할 수 있습니다.

observed <- as.vector(data)
Ts<-factor(rep(c("T1","T2","T3"),each=3))
Gs<-factor(rep(c("G1","G2","G3"),3))

model1<-glm(observed~Ts*Gs,poisson)

#or and a model without the interaction terms
model2<-glm(observed~Ts+Gs,poisson)


#you can compare the two models using anova with a chi-squared test
anova(model1,model2,test="Chi")
summary(model1)

최소 모형에 모든 방해 변수가 포함되어 있는지 항상 확인하십시오.

누가 다른 사람과 다른 사람인지 어떻게 알 수 있습니까? R 함수 assocplot는 2 차원 우연성 테이블에서 행과 열의 독립성과의 편차를 나타내는 연관 플롯을 생성합니다.

다음은 모자이크 플롯과 동일한 데이터입니다.

mosaicplot(data, shade = TRUE)

고마워요, 정확히 내가 필요한 것입니다. 과대 산포에 대해 이야기 할 때 무슨 의미인지 잘 모르겠습니다 (죄송합니다, 통계학자가 아닐 수도 있습니다. 아마도 매우 기본적 일 수도 있습니다) ... 잔차 이탈은 잔차 자유 도와 같아야합니다 ... 어떻게 확인하겠습니까?
니코

당신이 제공 summary(model1)하면 다음과 같은 것을 볼 수 있습니다Residual deviance: -2.7768e-28 on 0 degrees of freedom
George Dontas

4

다항 회귀 분석을 위해 nnet 패키지의 다항식 을 사용할 수 있습니다 . 사후 테스트 자동차 패키지의 linearHypothesis 를 사용할 수 있습니다 . 선형 가설 (Wald 테스트) 또는 anova (LR 테스트)를 사용하여 독립 테스트를 수행 할 수 있습니다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.