제 이름은 휴 (Hugh)이며, 탐색 분석을 위해 일반화 된 가산 모델을 사용하는 박사 과정 학생입니다.
MGCV 패키지에서 제공되는 p- 값을 해석하는 방법을 잘 모르고 내 이해를 확인하고 싶었습니다 (버전 1.7-29를 사용하고 있으며 Simon Wood의 문서 중 일부를 참조했습니다). 다른 CV 질문을 먼저 찾았지만 가장 관련성이 높은 질문은 GAM p- 값이 아니라 일반적인 회귀에 관한 것 같습니다.
GAM에 대한 다양한 주장이 있으며 p- 값은 대략적인 것입니다. 그러나 공변량에 "신호"가 있는지 알아보기 위해 간단하게 시작하고 있습니다. 예 :
Y ~ s (a, k = 3) + s (b, k = 3) + s (c, k = 3) + s (d, k = 3) + s (e, k = 3)
부드러운 항의 대략적인 p- 값 :
s (a) = 0.000473
s (b) = 1.13e-05
s (c) = 0.000736
s (d) = 0.887579
s (e) = 0.234017
R ² (조정 됨) = 0.62 편차 설명 = 63.7 %
GCV 점수 = 411.17 스케일 추정치 = 390.1 n = 120
서식으로 인해 df 열 등을 잘라 냈습니다. 각 공변량에 대한 p- 값을 해당 스무스 함수가 모델 편차를 크게 감소시키는 지 여부의 테스트로 해석합니다. 여기서 p는 null 모델 0에서 관찰 된 것보다 '상대적으로 타당하지 않은'데이터를 얻을 확률입니다.
이는 (예를 들어 알파 = 0.05에서) 평활화 된 함수가 "d"& "e"에 대한 이탈도를 null 모델과 비교하지 않았지만 다른 용어에 대해서는 그렇지 않음을 의미합니다. 따라서 (d)와 (e)는 회귀에 유의미한 정보를 추가하지 않으며 설명 된 편차는 (a) (b) (c)에 해당합니까?
모든 조언은 대단히 감사하겠습니다. 연구에 행운을 빕니다.