GAM P- 값을 해석하는 방법?


10

제 이름은 휴 (Hugh)이며, 탐색 분석을 위해 일반화 된 가산 모델을 사용하는 박사 과정 학생입니다.

MGCV 패키지에서 제공되는 p- 값을 해석하는 방법을 잘 모르고 내 이해를 확인하고 싶었습니다 (버전 1.7-29를 사용하고 있으며 Simon Wood의 문서 중 일부를 참조했습니다). 다른 CV 질문을 먼저 찾았지만 가장 관련성이 높은 질문은 GAM p- 값이 아니라 일반적인 회귀에 관한 것 같습니다.

GAM에 대한 다양한 주장이 있으며 p- 값은 대략적인 것입니다. 그러나 공변량에 "신호"가 있는지 알아보기 위해 간단하게 시작하고 있습니다. 예 :

Y ~ s (a, k = 3) + s (b, k = 3) + s (c, k = 3) + s (d, k = 3) + s (e, k = 3)

부드러운 항의 대략적인 p- 값 :

s (a) = 0.000473
s (b) = 1.13e-05
s (c) = 0.000736
s (d) = 0.887579
s (e) = 0.234017

R ² (조정 됨) = 0.62 편차 설명 = 63.7 % GCV 점수 = 411.17 스케일 추정치 = 390.1 n = 120

서식으로 인해 df 열 등을 잘라 냈습니다. 각 공변량에 대한 p- 값을 해당 스무스 함수가 ​​모델 편차를 크게 감소시키는 지 여부의 테스트로 해석합니다. 여기서 p는 null 모델 0에서 관찰 된 것보다 '상대적으로 타당하지 않은'데이터를 얻을 확률입니다.

이는 (예를 들어 알파 = 0.05에서) 평활화 된 함수가 "d"& "e"에 대한 이탈도를 null 모델과 비교하지 않았지만 다른 용어에 대해서는 그렇지 않음을 의미합니다. 따라서 (d)와 (e)는 회귀에 유의미한 정보를 추가하지 않으며 설명 된 편차는 (a) (b) (c)에 해당합니까?

모든 조언은 대단히 감사하겠습니다. 연구에 행운을 빕니다.

답변:


8

작동 방식을 설명하는 논문이 여기에 있습니다 .

그것들은 전체 함수 s (.) = 0 인 Wald 테스트와 관련된 p- 값입니다. 낮은 p- 값은 함수를 구성하는 스플라인이 함께 0 일 가능성이 낮음을 나타냅니다.

그들에 대한 복잡한 것은 그들이 감소 된 의사 역수를 포함한다는 것입니다. 일반적인 Wald 테스트는 입니다. 단 변량의 경우 (예 : 행렬이 아니라 베타 및 분산) t- 검정임을 즉시 알 수 있습니다. 이는 코 펜티 언트에 불이익을 가하기 때문에 불이익을받은 스플라인의 경우 전력이 매우 낮습니다. rank-r pseudoinverse가이를 설명합니다. 이 논문은 실제로 매우 조밀하지만 일단 일반 요점에 도달하면 매트릭스 순위 대신 EDF를 고려하여 테스트의 힘을 향상 시키면 공식화를 따르는 것이 가능해집니다.f^(Vβ)1f^

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.