범주 형 데이터를 사용하여 음 이항 GLM에서 .L 및 .Q 출력 해석


14

방금 음 이항 GLM을 실행했으며 출력입니다.

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

내 예측 변수는 모두 범주 형입니다. 내가 무엇입니까 왜인가 .L하고 .Q. 나는 그들이 다른 카테고리를 대표한다고 생각하지만 GLM을 실행하기 전에 다른 카테고리로 표시되도록 레이블을 지정할 수있는 코드를 아는 사람이 있습니까?



코드가 매우 혼동된다는 것을 알게되었습니다. 더 간단한 코드가 있습니까? 범주 1은 방법 1과 방법 2, 사이트 1, 사이트 2와 사이트 3이며 깊이는 5, 10, 15입니다
Vivienne

답변:


14

변수는 단순히 범주 형으로 만들기 위해 요인으로 코딩되는 것이 아니라 순서 요인 으로 코딩됩니다 . 그런 다음 기본적으로 R은 일련의 다항 함수를 변수 수준에 맞 춥니 다. 첫 번째는 선형 ( .L), 두 번째는 2 차 ( .Q), 세 번째 (충분한 레벨이있는 ​​경우)는 3 차입니다. R은 변수의 레벨 수보다 하나의 다항식 함수에 적합하지 않습니다. 예를 들어 레벨이 두 개인 경우 선형 추세 만 적합합니다. 또한, 사용 된 다항식 기저는 직교합니다. (가치가있는 것은 R이나 음 이항 모형에만 국한되는 것은 아닙니다. 모든 소프트웨어와 회귀 모델의 유형은 동일하지 않습니다.)


R에 중점을 두어 변수를 순서대로 또는 순서대로 코딩하려면 ? factor를 사용하십시오 .

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor

오, 라벨을 붙인 지금 주문 했으니 정말 고마워요!
Vivienne
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.