R 패키지 gamlss를 사용 하고 데이터가 0으로 증가하는 베타 분포를 가정 하고 GAM 기반 회귀 분석을 실행 중 입니다. 내 모델에는 단일 설명 변수 만 있으므로 기본적으로 다음과 같습니다 mymodel = gamlss(response ~ input, family=BEZI)
.
알고리즘은 설명 변수가 평균 ( )에 미치는 영향 대한 계수 와 대한 관련 p- 값을 제공합니다 .
Mu link function: logit
Mu Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.58051 0.03766 -68.521 0.000e+00
input -0.09134 0.01683 -5.428 6.118e-08
위의 예에서 볼 수 있듯이 k (\ text {input}) = 0 의 가설은 높은 신뢰도로 거부됩니다.
그런 다음 null 모델을 실행하고 null = gamlss(response ~ 1, family=BEZI)
우도 비 검정을 사용하여 우도를 비교합니다.
p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).
많은 경우에, 입력시 계수가 (위와 같이) 매우 중요하다고보고 된 경우에도 p> 0.05를 얻습니다 . 나는 이것이 선형이나 로지스틱 회귀에 대한 경험에서 결코 일어나지 않았다는 사실을 발견했다.
내 질문은 :이 경우 응답과 입력 간의 종속성을 여전히 신뢰할 수 있습니까?