혼란이 조금 더 간단한 것으로 인해 발생할 수 있다고 생각하지만 관련 문제를 검토 할 수있는 좋은 기회를 제공합니다.
본문은 모든 회귀 계수가 라고 주장 하지 않습니다. 는 연속 잔차 벡터를 통해
있지만 오히려 이 방법으로 마지막 하나 인 만 계산할 수 있습니다!β^i
β^i=?⟨y,zi⟩∥zi∥2,
β^p
연속적인 직교 화 체계 (Gram-Schmidt 직교 화의 형태)는 (거의) 한 쌍의 행렬을 생성합니다. 그리고 와 같이
여기서 는 직교 정규 열 이있는 이고 는 위 삼각형입니다. 알고리즘은 일반적으로 열이 아닌 열의 규범까지 를 지정하기 때문에 "거의"라고 말하지만 열을 정규화하고 좌표에 해당하는 간단한 조정을 수행하여 단위 규범을 가질 수 있습니다. 매트릭스 .ZG
X=ZG,
Zn×pG=(gij)p×pZG
물론 순위가 하면 고유 최소 제곱 솔루션은 시스템을 해결하는
벡터X∈Rn×pp≤nβ^
XTXβ^=XTy.
대체 하고 (구성에 의해)을 사용하면
이는
X=ZGZTZ=I
GTGβ^=GTZTy,
Gβ^=ZTy.
이제 선형 시스템 의 마지막 행에 집중하십시오 . 마지막 행에서 의 0이 아닌 유일한 요소 는 입니다. 그래서 우리는
그것은 (! 이해하는 검사로이를 확인) 것을보고 어려운 일이 아니다따라서 솔루션이 생성됩니다. ( 주의 사항 : 나는 이미 표준화 한 단위 규범을 사용했지만 책에서는 그렇지 않습니다 . 이것은 책이 분모에 제곱 규범을 가지고 있지만, 나는 규범 만 가지고 있다는 사실을 설명합니다.)Ggpp
gppβ^p=⟨y,zp⟩.
gpp=∥zp∥zi
모든 회귀 계수 를 찾으려면 개별 대한 간단한 단계를 수행해야합니다 . 예를 들어 행의 경우
그래서
이 절차는 시스템의 마지막 행에서 첫 번째 행까지 "뒤로"계속 진행하여 이미 계산 된 회귀 계수의 가중 합계를 빼고 의 주요 용어로 나누어 를 얻을 수 있습니다.β^i(p−1)
gp−1,p−1β^p−1+gp−1,pβ^p=⟨zp−1,y⟩,
β^p−1=g−1p−1,p−1⟨zp−1,y⟩−g−1p−1,p−1gp−1,pβ^p.
giiβ^i
ESL 섹션의 요점은 의 열을 재정렬하여 새로운 행렬 을 얻을 수 있다는 것 입니다. 번째 원본 열은 이제 마지막 열입니다. 새 행렬에 Gram–Schmidt 프로 시저를 적용하면 위의 간단한 솔루션으로 원래 계수 대한 해를 도록 새로운 직교 화를 얻습니다 . 이것은 회귀 계수 대한 해석 을 제공합니다 . 에서 설계 행렬의 나머지 열을 "회귀"하여 얻은 잔차 벡터에 대한 일 변량 회귀입니다 .XX(r)rβ^rβ^ryxr
일반적인 QR 분해
Gram–Schmidt 프로시 저는 의 QR 분해를 생성하는 한 가지 방법 일뿐 입니다. 실제로, 그람-슈미트 (Gram-Schmidt) 절차보다 다른 알고리즘 접근법을 선호해야하는 많은 이유가 있습니다.X
가계 반사와 기븐스 회전은이 문제에 대해보다 수치 적으로 안정적인 접근법을 제공합니다. QR 분해의 일반적인 경우에는 위의 개발이 변경되지 않습니다. 즉하자
될 임의 의 QR 분해 . 이어서, 상기와 동일 추론 대수 조작을 이용하여, 우리가 그 최소 제곱 솔루션 만족
이는 로 단순화됩니다
이후 상위 삼각, 다음 같은 backsubstitution 기법의 작품이다. 우리는 먼저 해결합니다.
X=QR,
Xβ^RTRβ^=RTQTy,
Rβ^=QTy.
Rβ^p아래에서 위로 거꾸로 진행하십시오. 선택을 위해
하는 QR 분해 알고리즘 일반적으로 이러한 관점에서, 수치 적 불안정성을 제어하고에 경첩을 사용하는 그람 - 슈미트는 일반적으로 경쟁 방식이 아니다.
를 직교 행렬로 분해하는 이러한 개념은 다른 것보다 조금 더 일반화 될 수 있으며 적합 벡터 대한 매우 일반적인 형태를 얻기 위해 조금 더 일반화 될 수 있지만이 응답이 이미 너무 길어질 까 걱정됩니다 .Xy^