모형 우도가 null보다 유의하게 높지 않은 경우 (GAM) 회귀 계수의 의의


10

R 패키지 gamlss를 사용 하고 데이터가 0으로 증가하는 베타 분포를 가정 하고 GAM 기반 회귀 분석을 실행 중 입니다. 내 모델에는 단일 설명 변수 만 있으므로 기본적으로 다음과 같습니다 mymodel = gamlss(response ~ input, family=BEZI).

알고리즘은 설명 변수가 평균 ( )에 미치는 영향 대한 계수 와 대한 관련 p- 값을 제공합니다 .케이μ케이(입력)=0

Mu link function:  logit                                               
Mu Coefficients:                                                      
              Estimate  Std. Error  t value   Pr(>|t|)                  
(Intercept)  -2.58051     0.03766  -68.521  0.000e+00                  
input        -0.09134     0.01683   -5.428  6.118e-08

위의 예에서 볼 수 있듯이 k (\ text {input}) = 0 의 가설은 케이(입력)=0높은 신뢰도로 거부됩니다.

그런 다음 null 모델을 실행하고 null = gamlss(response ~ 1, family=BEZI)우도 비 검정을 사용하여 우도를 비교합니다.

p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).

많은 경우에, 입력시 계수가 (위와 같이) 매우 중요하다고보고 된 경우에도 p> 0.05를 얻습니다 >0.05. 나는 이것이 선형이나 로지스틱 회귀에 대한 경험에서 결코 일어나지 않았다는 사실을 발견했다.

내 질문은 :이 경우 응답과 입력 간의 종속성을 여전히 신뢰할 수 있습니까?

답변:


1

이것이 GAM과 관련이있는 즉각적인 이유는 없습니다. 사실 같은 것에 대해 두 가지 테스트를 사용하고 있습니다. 통계에는 절대적인 확실성이 없기 때문에 하나는 중요한 결과를 제공하고 다른 하나는 그렇지 않을 가능성이 매우 높습니다.

아마도 두 테스트 중 하나는 단순히 더 강력하지만 (어쩌면 더 많은 가정에 의존 할 수도 있음), 또는 하나의 중요한 하나는 20 형 I 형 오류 일 수 있습니다.

좋은 예는 표본이 동일한 분포에서 나왔는지 여부에 대한 검정입니다. 매우 모수 적 검정이 있습니다 (T- 검정은이를 위해 사용할 수있는 것입니다. 평균이 다르면 분포도 마찬가지 임). 하나 : 파라 메트릭은 중요한 결과를 제공하지만 비 파라 메트릭은 그렇지 않을 수 있습니다. 마지막으로, 데이터 (I 입력) 단순히 특별한이기 때문에, 또는 비모수 테스트의 차이를 데리러의 샘플 크기가 충분하지 않기 때문에, 또는 파라 메트릭 테스트의 가정이, 거짓이기 때문에이 될 수 있기 때문에 측면 의 다른 테스트로 확인한 테스트 (다른 ​​분포)는 실제로 다릅니다 (다른 차이는 <-> "보다 높음"을 의미합니다).

하나의 테스트 결과에 중요한 결과가 표시되고 다른 테스트 결과가 약간 중요하지 않은 경우 너무 걱정하지 않아도됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.