GAM 모델의 신뢰 구간


14

mgcv::gam의 도움말 페이지 읽기 :

적합 모델을 사용하여 예측 된 수량에 대해 신뢰 / 신뢰할 수있는 간격을 쉽게 사용할 수 있습니다.

그러나 실제로 얻을 수있는 방법을 알 수는 없습니다. 나는 생각했다 predict.gamtype=confidencelevel매개 변수를하지만 그렇지 않습니다. 어떻게 만드는지 도와 줄 수 있습니까?

답변:


33

일반적인 방법으로 :

p <- predict(mod, newdata, type = "link", se.fit = TRUE)

그런 다음의 관측치 예측에 표준 오차 p가있는 성분 이 포함되어 있습니다 . 그런 다음 SE에 원하는 수준에 적절한 값을 곱하여 CI를 형성 할 수 있습니다. 예를 들어 대략 95 % 신뢰 구간은 다음과 같이 구성됩니다.$se.fitnewdata

upr <- p$fit + (2 * p$se.fit)
lwr <- p$fit - (2 * p$se.fit)

필요한 구간에 대해 또는 가우스 분포 에서 적절한 값을 대입 합니다.

내가 사용하는 것이 주 type = "link"당신이 GAM 또는 그냥 AM있는 경우에 당신이 말을하지 않는 한. GAM에서 선형 예측 변수의 스케일에 신뢰 구간을 형성 한 다음 역함수를 적용하여 응답의 스케일로 변환해야합니다.

upr <- mod$family$linkinv(upr)
lwr <- mod$family$linkinv(lwr)

이제는 대략적인 간격입니다. 또한 이러한 간격은 포인트 현명 예측 값에 있습니다 그리고 그들은 계정에 부드러움 선택이 수행 된 사실을 고려하지 않습니다.

모수의 사후 분포에서 시뮬레이션을 통해 동시 신뢰 구간을 계산할 수 있습니다. 내 블로그 에 그 예가 있습니다.

당신이 평활 매개 변수에 따라 조건없는 신뢰 구간을 원하는 경우 (즉 우리가 추정하는 대신 부드러움 매개 변수의 값을 알고 있지만하지 않는 것이 고려 하나), 다음 추가 unconditional = TRUE받는 predict()전화.

또한이 작업을 직접 수행하지 않으려는 경우 최신 버전의 mgcv 에는 평활도plot.gam() 와 플롯 간격의 플롯을 만드는 데 사용되는 모든 데이터가 포함 된 객체를 반환하는 함수가 있습니다. plot.gam()obj에 출력을 저장할 수 있습니다.

obj <- plot(model, ....)

그런 다음 objsmooth마다 하나의 구성 요소가있는 목록 인 inspect . 추가 seWithMean = TRUE받는 plot()부드러움 매개 변수에 따라 조건없는 신뢰 구간을 얻기 위해 호출.


동시 CI와 파라 메트릭 부트 스트랩을 수행하면 코드에 조금 더 관여하게되므로 포인트 단위의 간격으로 처리 할 수 ​​있습니다. 그렇지 않다면 각각에 대한 추가 예를 제공 할 수 있습니다.
복원 모니카-G. 심슨

답변은 +1입니다. 실제로 인상적인 블로그 게시물은 그래픽 기술을 향상시키기 위해 잠시 동안 공부할 것입니다.
jbowman

인상적인 블로그 게시물 ( ucfagls.wordpress.com/2011/06/12/… )에 액세스 할 수있는 방법은 무엇입니까? 현재 블로그에는 로그인이 필요합니다.
geneorama 2019

@geneorama 나는 Wordpress에서 내 블로그를 옮겼으며 1 년 동안 모든 URL에 대한 새 URL로 리디렉션하는 데 비용을 지불했지만 최근에 그 결과가 사라졌습니다. 미안합니다. 새 링크에서 편집했으며 로그인이 필요하지 않습니다. (로그인이 같은 게시물의 두 복사본을 방지하기 위해 내가 아직로서 워드 프레스 사이트에서 페이지를 삭제 너무 게으른있었습니다.)
분석 재개 모니카 - G. 심슨

원래 블로그 게시물 (이 Q & A의 편집 기록 참조)에는 동시 간격이 생성되는 방식에 근본적인 결함이있었습니다. 답변의 현재 (2016 년 12 월 기준) 버전의 링크는 동시 간격을 올바르게 계산합니다.
Monica Reinstate-G. Simpson

5

그냥 플로팅하려는 경우 plot.gam함수는 음영 인수를 사용하여 기본적으로 신뢰 구간으로 음영 처리됩니다. gam.vcomp간격을 얻는 것도 참조하십시오 .


5

패키지 mgcv(gam보다 최신)는 신뢰할 수있는 간격을 쉽게 표시합니다. 이 베이지안 접근 방식은 신뢰 구간과는 다르지만 수치 시뮬레이션에서 볼 수 있듯이 결과는 거의 동일합니다 ( mgra로 연결된 Marra and Wood논문 참조 ).


2
+1 Marra & Wood의 논문의 주요 결과는 Nychka가 경험적 Bayes 신뢰할 수있는 간격이 "기능에 따른"신뢰 구간으로 볼 때 매우 뛰어난 잦은 해석 / 행동을 갖는 이유에 대한 Nychka의 이해 / 설명을 개발한다는 것 입니다. 베이지안 또는 빈번한 방식으로 간격을 처리 할 수 ​​있으며1α간격이 대략적으로 유지됩니다.
복원 Monica Monica-G. Simpson
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.