3 단계 비상 대응표를 처리하는 적절한 방법


12

나는 여러 종에 대한 수 데이터, 그들이 수집 한 숙주 식물 및 비오는 날에 그 수집이 일어 났는지 여부와 함께 3 단계 우발 사태 표를 가지고 있습니다 (실제로 중요합니다!). R을 사용하면 가짜 데이터는 다음과 같습니다.

count    <- rpois(8, 10)
species  <- rep(c("a", "b"), 4)
host     <- rep(c("c","c", "d", "d"), 2)
rain     <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)


, , rain = 0

    species
host  a  b
   c 12 15
   d 10 13

, , rain = 1

    species
host  a  b
   c 11 12
   d 12  7

이제 두 가지를 알고 싶습니다 : 종은 숙주 식물과 관련이 있습니까? "비"가이 협회에 영향을 미칩니 까? 나는 이것을 위해 사용 loglm()했다 MASS:

 # Are species independent to host plants, given the effect of rain?
loglm(~species + host + rain + species*rain + host*rain, data=my.table)

 # Given any relationship between host plants and species, does rain change it?
loglm(~species + host + rain + species*host)

이것은 내 편안함 수준을 약간 벗어 났으며 모델을 올바르게 설정했는지 와이 질문에 접근하는 가장 좋은 방법인지 확인하고 싶었습니다.

답변:


10

첫 번째 질문을 해석하는 두 가지 방법이 있습니다.이 질문은 두 가지 방식으로 반영됩니다.“호스트 식물과 관련된 종이 있습니까?” 그리고,“비의 영향을 고려할 때 종은 숙주 식물과 독립적입니까?”

첫 번째 해석 은 종과 숙주가 의존적이지만 비가 오는지 여부와 상관없이 독립적이라는 관절 독립 모델에 해당합니다 .

pshr=pshpr

pshr(s,h,r)shrpsh(s,h,)pr

두 번째 해석은 조건부 독립 모델에 해당하며, 비가 오는지 여부에 따라 종과 숙주는 독립적입니다.

psh|r=ps|rph|rpshr=psrphr/pr

psh|r(s,h,r)r

이 모델을 R에서 테스트 할 수 있습니다 ( loglin잘 작동하지만 더 익숙합니다 glm).

count <- c(12,15,10,13,11,12,12,7)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
my.data <- as.data.frame.table(my.table)
mod0 <- glm(Freq ~ species + host + rain, data=my.data, family=poisson())
mod1 <- glm(Freq ~ species * host + rain, data=my.data, family=poisson())
mod2 <- glm(Freq ~ (species + host) * rain, data=my.data, family=poisson())
anova(mod0, mod1, test="Chi") #Test of joint independence
anova(mod0, mod2, test="Chi") #Test of conditional independence

mod1mod2mod0pshr=psphprsummary(mod2)

첫 번째 질문에 접근하는 다른 방법은 fisher.test(xtabs(count ~ host + species))축소 된 2x2 테이블 (첫 번째 해석) 또는 mantelhaen.test(xtabs(count ~ host + species + rain))2 층화 된 2x2 테이블에 대한 Mantel-Haenszel 테스트 ( )에서 Fischer의 정확한 테스트 ( ) 를 수행 하거나 계층화를 존중하는 순열 테스트를 작성하는 것입니다 (두 번째 해석).

두 번째 질문을 바꾸어 말하면, 종과 숙주 사이의 관계는 비가 내 렸는지 여부에 달려 있습니까?

mod3 <- glm(Freq ~ species*host*rain - species:host:rain, data=my.data, family=poisson())
mod4 <- glm(Freq ~ species*host*rain, data=my.data, family=poisson())
anova(mod3, mod4, test=”Chi”)
pchisq(deviance(mod3), df.residual(mod3), lower=F)

전체 모델 mod4은 포화 상태이지만 mod3위에서 한 것처럼 이탈도를보고 문제의 효과를 테스트 할 수 있습니다 .


감사합니다 Lockedoff, 특히 조건 및 공동 독립 모델 사이의 차이 WRT 내 자신의 생각을 밖으로 정렬 저를 도와 주셔서
데이비드을 승

1

hostrainhostrain

R 명령은 다음과 같습니다.

glm (수식 = 종 ~ 숙주 + 비, 가족 = 이항 (logit), 무게 = 카운트)

p


1
로지스틱 회귀는 괜찮은 것처럼 보이지만 행 및 열 합계에 대한 추가 제약 조건이 있습니다. 포아송 데이터의 경우에는 그렇지 않을 수 있습니다. 나는 대답이 크게 다르지 않을 것이라고 믿습니다.
suncoolsu

1

처음에는 vegan패키지 에서 제한된 안수 기술 중 하나를 시도해 보라고 제안 했지만 실제로 두 개의 우발성 테이블이 있기 때문에 이것이 유용 할 것이라고 생각합니다. 이 예제 의 두 번째 부분 인 [PDF : R Demonstration – Categorical Analysis]가 도움 되길 바랍니다 .


무슨 뜻 않았다 링크가 깨진 생각 여기에이 범주를 ? 도움이되었습니다. 감사합니다!
david w

예, URL의 공백이 깨지는 것 같습니다.
ils
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.