LOOCV 공식 증명


18

James et al.의 통계 학습 에 이르기까지 Leave-One-Out Cross-Validation) 추정치는 여기서 입니다.MSEI=(Y는I - Y I)(2)

CV(n)=1ni=1nMSEi
MSEi=(yiy^i)2

증거가 없으면 식 (5.2)에 최소 제곱 또는 다항식 회귀의 경우 (한 변수에 대한 회귀에 적용되는지 여부는 알 수 없음) 여기서 " 는 원래 최소 제곱 피팅 의 번째 적합 값 ( 이것이 의미 하는 바는 데이터 세트의 모든 점 을 사용한다는 의미는 무엇입니까?) 는(Y)I

CV(n)=1ni=1n(yiy^i1hi)2
y^iih i = 1hi
hi=1n+(xix¯)2j=1n(xjx¯)2.

이것을 어떻게 증명할 수 있습니까?

내 시도 : 이지만 이것으로부터 (그리고 내가 기억한다면, 에 대한 은 단순한 선형 회귀에만 적용됩니다 ...), 나는 여기서 어떻게 진행 해야할지 모르겠습니다.시간

y^i=β0+i=1kβkXk+some polynomial terms of degree 2
hi

당신의 방정식은 하나 이상의 것을 위해 를 사용하는 것처럼 보이 거나 매우 혼란 스럽습니다. 어느 쪽이든 추가 선명도가 좋을 것입니다. i
Glen_b -Reinstate 모니카

@Glen_b 어제 LOOCV에 대해 배웠으므로 일부 내용을 제대로 이해하지 못할 수도 있습니다. 내가 이해 한 바에 따르면, 와 같은 데이터 포인트 세트가 있습니다 . LOOCV를 사용하면 각 고정 (양수) 유효성 검사 세트 및 테스트 세트 는 각 대한 적합 모형을 생성하는 데 사용됩니다 . 예를 들어, 우리는 세 개의 데이터 포인트 과 함께 간단한 선형 회귀를 사용하여 모델을 적합 시킵니다. 우리는 (계속)k V k = { ( x k , y k ) } T k = XV k k X = { ( 0 , 1 ) , ( 1 , 2 ) , ( 2 , 3 ) }X={(xi,yi):iZ+}kVk={(xk,yk)}Tk=XVkkX={(0,1),(1,2),(2,3)}
Clarinetist

@Glen_b 및 입니다. 의 점 을 사용하면 간단한 선형 회귀를 사용하여 됩니다. 그런 다음 을 유효성 검사 세트로 사용하여 를 계산하고 주어진 점을 사용하여 얻습니다. 이며 입니다. 좋아, 어쩌면 위첨자를 사용하는 것이 가장 좋은 생각은 아니었을 것입니다-나는 원래 게시물에서 이것을 바꿀 것입니다. T 1 = { ( 1 , 2 ) , ( 2 , 3 ) }V1={(0,1)}T1={(1,2),(2,3)}Y I =X+1MSE V 1 , Y 1 =1 개 , Y ( 1 ) 1 =0+1=1 MSE 1 =0T1y^i=X+1MSEV1y1=1y^1(1)=0+1=1MSE1=0
Clarinetist

여기에 파생에 대한 몇 가지 강의 노트입니다 pages.iu.edu/~dajmcdon/teaching/2014spring/s682/lectures/...은
자비에 BOURRET Sicotte

답변:


17

회귀가 다항식인지 여부에 관계없이 여러 선형 회귀 분석의 결과를 보여 드리겠습니다 . 실제로 각 LOOCV 잔차가 (5.2)에서와 같이 LOOCV 오류를 얻을 수있는 것이 아니라 전체 회귀 분석에서 해당 레버리지 가중 잔차와 동일하다는 것을 보여주기 때문에 요청한 것보다 조금 더 많이 표시합니다. 평균의 각 항이 같지 않더라도 평균이 일치하는 다른 방법 일 수 있습니다.Xt

약간 적응 된 표기법을 자유롭게 사용할 수 있습니다.

먼저 여기서 는 모든 데이터를 사용한 추정치이며 는 추정치입니다. , 관측치 . 하자 행 벡터로 정의 할 수와 같은 그 . 는 잔차입니다.(A) β β (t)X(t)tXt Y t=Xt β

β^β^(t)=(u^t1ht)(XX)1Xt,(A)
β^β^(t)X(t)tXty^t=Xtβ^u^t

증명은 다음 행렬 대수 결과를 사용합니다.

하자 하는 정칙 행렬 벡터와 스칼라. 경우 그 다음 b λ λAbλ

λ1bA1b
(A+λbb)1=A1(λ1+λbA1b)A1bbA1(B) 

(B)의 증거는

{A1(λ1+λbA1b)A1bbA1}(A+λbb)=I.

다음 결과는 (A)를 증명하는 데 도움이됩니다.

(X(t)X(t))1Xt=(11ht)(XX)1Xt. (C)

(C)의 증거 : (B) 우리는 , 따라서 t=1TXtXt=XX

(X(t)X(t))1=(XXXtXt)1=(XX)1+(XX)1XtXt(XX)11Xt(XX)1Xt.
(X(t)X(t))1Xt=(XX)1Xt+(XX)1Xt(Xt(XX)1Xt1Xt(XX)1Xt)=(11ht)(XX)1Xt.

의 증거 (A) 지금 (C)에서 다음과 같이가 우리가 또는 따라서 여기서 마지막 평등은 (C)에서 따릅니다.

XXβ^=Xy,
(X(t)X(t)+XtXt)β^=X(t)y(t)+Xtyt,
{Ik+(X(t)X(t))1XtXt}β^=β^(t)+(X(t)X(t))1Xt(Xtβ^+u^t).
β^=β^(t)+(X(t)X(t))1Xtu^t=β^(t)+(XX)1Xtu^t1ht,

이제 . 곱셈에 의한 (A)쪽으로 추가 으로 얻을 양측 순차에 를 사용으로 인한 잔류 ( ), 또는 ht=Xt(XX)1XtXtytu^(t)β^(t)ytXtβ^(t)

u^(t)=u^t+(u^t1ht)ht
u^(t)=u^t(1ht)+u^tht1ht=u^t1ht

답변 에 대한 정의 가 없습니다. 이것이 행 제거 된 행렬 라고 가정합니다 . X(t)XXt
mpiktas

또한 도 도움이 될 것입니다. XX=t=1TXtXt
mpiktas

@mpiktas, 예, 포인터 주셔서 감사합니다. 첫 번째 의견을 고려하여 편집했습니다. 두 번째가 정확히 어디에서 도움이 될까요? 아니면 당신의 의견에 남겨주세요?
Christoph Hanck

3
(C)의 증거를 시작할 때 . 그것은 좋은 트릭이지만 우연한 독자가 그것을 알고 있다고 의심합니다. (X(t)X(t))1=(XXXtXt)1
mpiktas

1
2 년 후 ... 저는이 대답에 대해 더 감사합니다. 이제 대학원 수준의 선형 모델 시퀀스를 살펴 보았습니다. 이 새로운 관점으로이 자료를 다시 배우고 있습니다. 이 답변에서 가지고있는 것과 같은 파생을 통해 제안 된 참고 문헌 (교과서?)이 자세히 있습니까?
Clarinetist
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.