답변:
하나는 이차적 인 형태이기 때문에
양의 반정의 값이며, 최소값 인 가 있으며 을 사용하여 최소값을 찾습니다 ( 에 대한 기울기 를 0 으로 설정하여 ).β
어디서 관계없이 계급의 적어도 하나 개의 솔루션이 있어야합니다 . 그러나이 주장은 문제의 정신에있는 것 같지 않으며 순수한 대수적 진술로 보인다. 아마도 그러한 방정식이 왜 해를 구해야하며 정확히 어떤 조건에서 이해해야 하는지를 이해하는 것이 좋습니다. 다시 시작하여 최소 제곱과의 연결을 모른다고 가정 해 봅시다.
그것은 모두의 의미에 내려 오는 의 전치 . 이것은 간단한 정의, 적절한 표기법 및 비 퇴행 적 세스 퀴 리니어 형식 의 개념으로 드러날 것입니다. 그 리콜 의 "설계 행렬"인 행 (관측 각 하나)과 (일정한있는 경우를 포함하여 각각의 변수에 대해 하나씩) 컬럼. 따라서 이는 벡터 공간 에서 의 선형 변환을 나타냅니다 . X X n p V = R p W = R n
선형 변환 이라고 생각 되는 의 조옮김은 이중 공간 의 선형 변환입니다 . 같은 조성물 이해하기 위해서는 하고, 그것을 확인하는 것이 필요하다 와 . 이것이 의 일반적인 내부 곱 (제곱합)이하 는 일입니다.X ′ : W ∗ → V ∗ X ′ X W ∗ W W
실제로 및 각각 두 개의 내부 제품 및 정의되어 있습니다. 이것들은 변성되지 않은 실제 이중선 대칭 함수입니다 . 후자는g W V W
대한 유사한 진술이 . 기하학적으로 이러한 내부 제품을 사용하면 길이와 각도를 측정 할 수 있습니다. 조건 은 가 대해 "수직"인 것으로 생각 될 수있다 . 비 퇴질은 제로 벡터 만 전체 벡터 공간에 수직임을 의미합니다. (이 일반성은 여기서 얻은 결과가 일반화 된 최소 제곱 설정에 적용된다는 것을 의미합니다. 는 반드시 구성 요소의 곱으로 주어진 일반적인 내부 제품은 아니지만 임의의 비 형태입니다. 완전히 생략 할 수 있습니다 정의, g ( u , v ) = 0 u v g W g V X ' : W → V ∗그러나 많은 독자들이 이중 공간에 익숙하지 않거나 불편할 것으로 예상하므로이 공식을 피하도록 선택하십시오.)
이러한 내부 제품을 사용하면 선형 변환 의 전치 가 로 정의됩니다 viaX ' : W → V
모든 와 . 실제로이 속성을 가진 벡터 가 존재한다는 것은 와 대한 물건을 작성함으로써 확립 될 수 있습니다 ; 이 벡터는 내부 제품의 비 퇴질성에 따라 고유하다는 점이 다릅니다. 경우 용 및 두 벡터가 어느위한 모두 후 (첫 번째 구성에서 선형성) 모든 의미를 . v ∈ V X ′ ( w ) ∈ V V W v 1 v 2 g V ( v 1 , v ) = g V ( v 2 , v ) v ∈ V g V ( v 1 - v 2 , v ) = 0 v v 1 − v 2 = 0
경우 기입 모든 벡터의 집합에 대해 수직 인 모든 벡터에 . 또한 표기법, 쓰기의 문제로 의 이미지에 대한 집합으로 정의, . 근본적인 관계 사이의 및 트랜스 이고U ⊥ U X ( V ) X { X ( V ) | v ∈ V } ⊂ W X X '
즉, 의 커널에 경우에만, 의 화상에 수직 인 . X ' w X 이 주장은 두 가지를 말합니다.
경우 이어서, 모든 단순히 는 직교 함을 의미합니다 .g W ( w , X ( v ) ) = g V ( X ′ ( w ) , v ) = g V ( 0 , v ) = 0 v ∈ V w X ( V )
경우에 직교 만 수단, 모두 하지만 이것에 상당 그리고 nondegeneracy 의미 .X ( V ) g W ( w , X ( v ) ) = 0 v ∈ V g V ( X ' ( w ) , v ) = 0 g V X ' ( w ) = 0
우리는 실제로 끝났습니다. 분석 결과 는 직접 곱으로 분해됩니다. . 즉, 우리가 임의 취할 수있는 임의의 고유를 작성할 때 으로 및 . 이는 이 하나 이상의 대해 형식 임을 의미 합니다. 그러면W = X ( V ) ⊕ X ( V ) ⊥ y ∈ W y = y 0 + y ⊥ y 0 ∈ X ( V ) y ⊥ ∈ X ( V ) ⊥ y 0 X ( β ) β ∈ V
근본적인 관계는 그것이 의 커널에있는 왼쪽과 같다고 말합니다 .
whence 는 정규 방정식X ' X β = X ' , Y .
우리는 이제 질문에 대한 간단한 기하학적 해답을 제시 할 수있는 위치에있다 : 어떤 공식은 -vector 가 벡터의 합으로 (독특하게) 분해 되기 때문에 해를 구한다 의 범위에서 와 다른 벡터 직교 및 적어도 하나 개의 화상 인 - 벡터 . 이미지 의 치수 ( 순위 )는 식별 가능한 매개 변수 의 치수입니다 . 커널의 차원y ∈ W y 0 X y ⊥ y 0 y 0 p β ∈ V X ( V ) X X V W매개 변수 사이의 사소한 선형 관계를 계산합니다. 가 에서 의 이미지 까지 일대일 맵인 경우 모든 매개 변수를 식별 할 수 .
공간을 모두 없애고 행렬 의 "열 공간"인 부분 공간 와 함께 작동 하는 것이 궁극적으로 유용합니다 . 정규 방정식은 에 직교 투영 됩니다. 이는 우리가 개념적으로 모델의 특정 매개 변수화에 묶이지 않도록 해주 며 최소 제곱 모델은 매개 변수화 방법에 관계없이 본질적인 차원을 가지고 있음을 보여줍니다 .U = X ( V ) ⊂ W X U
이 추상 대수 데모의 흥미로운 결과 중 하나 는 임의의 벡터 공간에서 정규 방정식을 풀 수 있다는 것입니다. 예를 들어, 복잡한 공간, 유한 필드 위의 공간 (제곱의 합을 최소화하는 것은 거의 의미가 없음), 심지어 적절한 등분 형태를 지원하는 무한 차원 공간에서도 결과가 유지됩니다.
샘플 세트에 두 개 이상의 고유 한 (예측 자) 이있는 경우 의 역이 존재 한다는 것을 쉽게 보여줄 수 있습니다 (임의의 포인트 수 ) . 모든 데이터의 값이 (예 : 수직선을 따라 방향으로 쌓인 점) 가 동일한 경우에만 평균 을 통해 그려진 선 은 임의의 기울기 (회귀 계수)를 갖습니다. 그러면 LSE 회귀선이 고유하지 않습니다.
일반적인 회귀 분석에서 X는 마른 체형이므로 확실히 되돌릴 수 없습니다 (돌이킬 수없는 상태 일 수 있음). X가 마른 체형이고 뒤집을 수없는 경우 X ^ T * X는 되돌릴 수 없음을 증명하는 것이 간단합니다 (도움이 필요한 경우 요청). 이 경우 정확히 하나의 솔루션이 있습니다. X에 전체 열 순위가 없으면 X ^ T * X는 전체 순위가 아니므로 시스템이 결정되지 않습니다.