비선형 회귀에 대한 예측 대역을 계산하는 방법은 무엇입니까?


16

Prism 의 도움말 페이지 는 비선형 회귀에 대한 예측 밴드를 계산하는 방법에 대한 다음 설명을 제공합니다. 긴 따옴표를 용서하십시오.하지만 두 번째 단락을 따르지 않습니다 ( 가 정의되고 가 계산되는 방법을 설명합니다 ). 도움을 주시면 감사하겠습니다.|엑스와이/

신뢰도와 예측 대역의 계산은 상당히 표준입니다. 프리즘이 비선형 회귀의 예측 및 신뢰 구간을 계산하는 방법에 대한 자세한 내용을 읽으십시오.

먼저 G | x를 정의 해 봅시다. 이는 특정 X 값에서 매개 변수의 기울기이며 모든 매개 변수의 가장 적합한 값을 사용합니다. 결과는 매개 변수 당 하나의 요소가있는 벡터입니다. 각 매개 변수에 대해 dY / dP로 정의됩니다. 여기서 Y는 X의 특정 값과 모든 가장 적합한 매개 변수 값이 주어지면 곡선의 Y 값이고 P는 매개 변수 중 하나입니다.)

G '| x는 그 그라디언트 벡터가 바뀐 값이므로 행이 아닌 열입니다.

Cov는 공분산 행렬입니다 (마지막 반복에서 반전 된 Hessian). 행 수와 열 수가 매개 변수 수와 동일한 정사각 행렬입니다. 행렬의 각 항목은 두 모수 간의 공분산입니다.

이제 c = G '| x * Cov * G | x를 계산하십시오. 결과는 X 값에 대한 단일 숫자입니다.

신뢰도와 예측 밴드는 최적 곡선에 중심을두고 곡선 위와 아래에서 같은 양으로 확장됩니다.

신뢰 대역은 다음과 같이 곡선 위와 아래로 확장됩니다. = sqrt (c) * sqrt (SS / DF) * CriticalT (Confidence %, DF)

예측 대역은 다음과 같은 곡선 위와 아래의 추가 거리로 확장됩니다. = sqrt (c + 1) * sqrt (SS / DF) * CriticalT (Confidence %, DF)




이것은 실제로 델타 방법으로 알려져 있으며 1 차 Taylor 근사값을 사용합니다. 이것을 위해 2 차 Taylor 근사를 사용하는 것이 좋습니다. propagate 패키지의 predictNLS 함수는 관심이 있다면 그렇게합니다!
Tom Wenseleers

답변:


18

이것을 델타 방법이라고합니다.

일부 기능이 있다고 가정 ; 참고 G는 ( ) , 당신이 예상하는 매개 변수의 함수이다 β 하고 예측 값, X . 먼저 매개 변수 벡터 β : G ' ( β , x ) 와 관련하여이 함수의 미분을 찾으십시오 .와이=(β,엑스)+ϵ()β엑스β'(β,엑스). 이것은 매개 변수를 약간 변경하면 기능이 얼마나 변경됩니까? 이 도함수는 예측 변수뿐만 아니라 모수 자체의 함수일 수도 있습니다. 예를 들어, 이면 미분은 x exp ( β x ) 이며 이는 β 값과 x 값에 따라 다릅니다 . 이를 평가하기 위해, 당신의 추정치를 연결 β 프로 시저주는 것으로, β 및 예측의 값 X(β,엑스)=특급(β엑스)엑스특급(β엑스)β엑스ββ^엑스 당신이 예측을 원하는 곳.

최우 절차로부터 파생 델타 방법,의 분산한다고 될 것이다 G ' ( β , X ) T 바르 ( β ) G ' ( β , X ) , 바르 ( β )(β^,엑스)

'(β^,엑스)바르(β^)'(β^,엑스),
바르(β^)는 추정치의 분산-공분산 행렬입니다 (이는 Hessian의 역수와 같습니다-추정치에서 우도 함수의 2 차 미분). 통계 패키지가 사용하는 함수는 예측 변수 의 각기 다른 값에 대해이 값을 계산합니다 . 이것은 x의 각 값에 대한 벡터가 아닌 숫자 입니다.엑스엑스

이것은 각 점에서의 함수 값의 분산을 제공하고 이것은 단지 신뢰 구간을 계산의 다른 분산과 같이 사용됩니다 : 일반 또는 적용에 대한 임계 값에 의해 곱셈,이 값의 제곱근을 t의 A에 대한 관련 유통 신뢰 수준을 높이고이 값을 더하여 빼기 시점 의 추정치 에 더합니다.()

예측 구간의 경우 예측 변수 , Var ( y x ) σ 2가 주어진 결과의 분산 을 고려해야합니다. 따라서, 우리의 분산의 추정치에 의해 델타 방법에서 우리의 분산을 강화해야한다 ε , σ 2 의 분산 얻을, Y 보다는의 기대 값의 분산 Y 신뢰 구간에 사용됩니다. 참고 것을 σ 2 (제곱 오차의 합이다 자유도로 나눈 도움말 파일 표기법이) ( ).엑스바르(와이엑스)σ2ϵσ^2와이와이σ^2SSDF

위의 도움말 파일에 사용 된 표기법에서 σ 2 값을 고려 c하지 않은 것처럼 보입니다 . 즉, 그들의 헤 시안의 역수는 내가주는 것의 σ - 2 배입니다. 그들이 왜 그런지 잘 모르겠습니다. 신뢰와 예측 구간을보다 친숙한 방식으로 쓰는 방법이 될 수 있습니다 ( σ의 횟수를 몇 배나 중요한 값 으로 곱함 ). 내가주는 차이는 실제로 그들의 표기법에 있습니다.σ2σ2σc*SS/DF

c(엑스'엑스)1바르(β^)=σ2(엑스'엑스)1


ci 계산을 설명 할 수 있습니까? t * sqrt (var)의 임계점처럼 보이지 않음
B_Miner

나는 그들의 계산을 이해한다고 생각합니다. 응답을 업데이트했습니다.
찰리

찰리, 자세한 답변 감사합니다. 95 % 예측 대역을 계산할 수있는 코드를 작성하려고합니다. 어떻게되는지 알려 드리겠습니다.
Joe Listerr

@ 찰리-아주 좋은!
B_Miner

2
@야경. 감사. 그래프 패드 프리즘 FAQ에 cov를 사용하여 정규화 된 공분산 행렬을 의미한다고 설명하는 문장을 추가했습니다 (각 값의 범위는 -1에서 1까지). 또한이 페이지에 대한 링크를 추가했는데, 이는 수학적 세부 정보를 찾는 사람에게 유용합니다.
Harvey Motulsky
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.