GLM에서 절편 용어를 해석하는 방법은 무엇입니까?


20

R을 사용하고 있으며 Binomial 링크가있는 GLM으로 데이터를 분석하고 있습니다.

출력 테이블에서 인터셉트의 의미가 무엇인지 알고 싶습니다. 내 모델 중 하나에 대한 절편은 크게 다르지만 변수는 다릅니다. 이것은 무엇을 의미 하는가?

요격이란 무엇입니까? 나는 단지 자신을 혼란스럽게하지만 인터넷을 검색했는지 모르겠습니다. 단지 말하는 것이 없습니다.

매우 좌절 한 학생을 도와주세요


glm(formula = attacked_excluding_app ~ treatment, family = binomial, 
    data = data)
Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.3548   0.3593   0.3593   0.3593   0.3593  
Coefficients:
                         Estimate Std. Error z value Pr(>|z|)   
(Intercept)                 2.708      1.033   2.622  0.00874 **
treatmentshiny_non-shiny    0.000      1.461   0.000  1.00000

(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963  on 31  degrees of freedom
Residual deviance: 14.963  on 30  degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5

1
glm에서 지정하는 링크 기능은 무엇입니까?
Tomas

5
절편은 모든 독립 변수가 0 일 때 종속 변수의 예측 값입니다. 모델에 대한 추가 정보가 없으면 이것이 귀하의 경우에 의미가 있는지 말할 수 없습니다.
Peter Flom-Monica Monica 복원

답변:


21

절편 항은 GLM 방정식의 선형 부분에서 절편이므로 평균에 대한 모형은 . 여기서 g 는 링크 함수이고 X β 는 선형 모형입니다. 이 선형 모형에는 "절편 항"이 포함됩니다.E[Y]=g1(Xβ)gXβ

Xβ=c+X1β1+X2β2+

귀하의 경우 절편은 0이 아니지만 크게 변수는 아닙니다.

Xβ=c0

링크 함수가 이항이기 때문에

g(μ)=ln(μ1μ)

따라서 절편 항만 사용하면 평균에 대한 적합 모형은 다음과 같습니다.

E[Y]=11+ec

경우 Y = 1 또는 0을 얻을 수있는 50:50의 확률에 해당하는 것을 볼 수 있습니다 . 즉 E [ Y ] = 1c=0E[Y]=11+1=0.5

결과는 결과를 예측할 수 없지만 한 클래스 (1 또는 0)가 다른 클래스보다 가능성이 높다는 것입니다.


2
당신은 E [Y] = .... :)에서 나를 무섭게했습니다. 답장을 보내 주셔서 감사합니다. 당신이하는 말을 이해합니다. 당신은 요격이 시그라고 말했다. 0이 아닌 var. 그렇지 않으면 p = 1.00입니다!? p-value 변수가 결과에 대해 말할 수있는 것에 어떤 영향을 미칩니 까?
Samuel Waldron

2
변수 p- 값이 작지 않으면 일반적으로 모델에 해당 변수가 포함되지 않습니다. 귀하의 경우 변수는 0이 아닌 값으로 추정되지 않으므로 p- 값은 1.00입니다. 기본적으로 "treatment"와 "attacked_clude_app"사이에는 관계가 없습니다. 관계가 없으면 여기에 너무 완벽하여 작은 데이터 세트가 있지만 거의 의심됩니다. 데이터를 시각화하고 합리적인지 확인하는 것이 좋습니다.
Corone

2
답변에 대해 +1 (그리고 데이터 집합에서 이상한 일이 일어나고 있다는 의견의 제안) 나는 당신의 의견의 시작에 동의하지 않지만 "변수 p- 값이 작지 않으면 일반적으로 모델." 이것은 반드시 그런 것은 아닙니다. 종종 "중요하지 않은"관계 라 할지라도 관계의 규모를보고하려고합니다 (그리고 더 나아가서, 관계를 모델링하는 데 관심이 있다면, null 결과는 여전히보고하는 것이 중요합니다.)
James Stanley

1
@James-매우 좋은 점, 항상 테스트 한 변수를보고해야합니다. 더 명확해야했습니다. 나는 일반적으로 모델을 사용하여 예측을 시도 할 때 해당 변수를 포함하지 않을 것임을 의미했습니다 (보통 과적 합을 의미하기 때문에) ).
Corone

@Corone-stats.stackexchange.com/ questions
17624

5

데이터에 문제가있는 것 같습니다. 계수에 대한 모수 추정값이 0.000 일 가능성이 높습니다. DV와 IV 모두 이분법 적이며 DV의 비율이 IV와 전혀 다르지 않은 것 같습니다. 이게 옳은 거니?

내 의견에서 언급했듯이 (@corone의 대답에서 알 수 있듯이) 인터셉트는 IV가 0 일 때 DV의 값입니다. IV는 어떻게 코딩 되었습니까? 그러나 계수의 추정치가 0.000이라는 사실은 IV가 아무런 차이가 없다는 것을 의미합니다.

log(p1p)


안녕하세요 여러분, 다시 한 번 의견에 감사드립니다. 데이터 포인트는 거의 동일합니다. 나는 보고서에보고하고 그럼에도 불구하고 강조해야합니다. 이것이 결과가 이상하게 보이는 이유입니다. 이 데이터 (GLM) 및 내 보고서 (GLMM)의 다른 데이터 세트를 사용하여 걸을 수 있기 전에 필연적으로 실행되고 있습니다 (# TEAM2x2x2x2). 제 주요 문제는보고해야 할 내용을 아는 것입니다. 인터셉트 또는 IV에 대한 통계를 멘토링합니까? 아래는 이항 링크가있는 다시 (나의 표준) GLMM입니다.
Samuel Waldron

라플라스 근사치에 맞는 일반화 된 선형 혼합 모형 공식 : 공격 ~ 치료 + 시험 + 치료 * 시험 + (1 | 조류) 데이터 : 데이터 AIC BIC logLik deviance 139.6 153.8 -64.78 129.6 랜덤 효과 : 그룹 이름 편차 Std.Dev. 조류 (절편) 0.87795 0.93699 obs 수 : 128, 그룹 : 조류, 32
Samuel Waldron

고정 효과 : Std. 오류 z 값 Pr (> | z |) (절편) 3.19504 0.90446 3.533 .000412 *** Treatmentshiny_non-shiny 0.02617 1.26964 0.021 .983558 Trial -1.53880 0.36705 -4.192 2.76e-05 *** 처리 : 시행 0.16909 0.49501 0.342 732732655 --- Signif. 코드 : 0 ' '0.001 ' '0.01 ' '0.05 '.' 0.1 ''1 고정 효과의 상관 관계 : (Intr) Trtm_- 시험판 Trtmntshn_- -0.712 시험판 -0.895 0.638 Trtmnts _- : T 0.664 -0.896 -0.742
Samuel Waldron

3

귀하의 경우, 절편은에 attacked_excluding_app관계없이 모든 데이터에 대해 계산 된의 평균 입니다 treatment. 계수 표의 유의성 검정은 0과 유의하게 다른지 여부를 검정하는 것입니다. 이것이 관련이 있는지 여부는 사전에 이유가 있는지 여부에 따라 다릅니다.

예를 들어, 혈압에 미치는 영향에 대해 약물과 위약을 테스트했다고 가정하십시오. 각 피험자에 대해 계산 (치료 후 압력-치료 전 압력)을 통해 혈압의 변화를 기록하고이를 분석에서 종속 변수로 취급합니다. 그런 다음 치료 효과 (약물 대 위약)가 중요하지 않지만 절편이 크게> 0이라는 것을 알 수 있습니다. 이는 평균적으로 두 측정 시간 사이에 피험자의 혈압이 증가했음을 나타냅니다. 이것은 흥미로울 수 있으며 추가 조사가 필요합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.