하자 관측과의 숫자 설명 변수의 개수.KNK
NX 는 실제로 행렬입니다. 단일 관측 값을 볼 때만 각 관측 값을 일반적으로 - 열 벡터 곱한 특정 관측 값 스칼라의 설명 변수 행 벡터로 표시 합니다. 또한 는 모든 관측 값 보유 하는 열 벡터 입니다.N×KxTiK×1βYN×1Yn
이제 2 차원 초평면은 벡터 와 1 (!) 열 벡터 사이에 걸쳐 있습니다. 기억 A는 매트릭스를 각각 설명 변수는 행렬의 단 하나 개의 열 벡터로 표시되도록 . 설명 변수가 하나만 있고 intercept 및 경우 모든 데이터 포인트는 와 확장 된 2 차원 평면을 따라 배치 됩니다.YXXN×KXYYX
다중 회귀 분석의 경우 와 행렬 사이의 초평면에는 총 몇 개의 차원 이 있습니까? 답 : 에 설명 변수의 열 벡터 가 있으므로 차원 초평면이 있어야합니다 .YXKXK+1
일반적으로, 매트릭스 설정에서, 회귀는 기울기 계수의 합리적인 분석을 위해 일정한 절편이 편향되지 않아야합니다. 이 트릭을 수용하기 위해, 행렬 의 한 열 은 " s" 로만 구성 됩니다. 이 경우 추정값 은 임의의 설명 변수 대신 각 관측 값에 대한 상수를 곱한 값입니다. 계수 의 기대치 따라서 나타내는 주어진 그런 값 1을 고정하고 다른 모든 변수가 제로되어있다. 따라서 차원 초평면은 차원 씩 차원 부분 공간으로 축소 되고X1β1β1Yx1iK+1Kβ1 은이 차원 평면 의 "절편"에 해당합니다 .K
행렬 설정에서는 결과의 직관을 찾을 수 있는지 확인하기 위해 항상 2 차원의 간단한 사례를 살펴 보는 것이 좋습니다. 여기서, 가장 간단한 방법은 두 설명 변수로 단순 회귀 생각이다
또는 대안 행렬 대수 표현 : 여기서 인 행렬.
yi=β1x1i+β2x2i+ui
Y=Xβ+uXN×2
<Y,X> 는 3 차원 초평면에 걸쳐 있습니다.
이제 을 모두 로 강제 설정하면
를 얻습니다.
2 차원 플롯 으로 표현할 수있는 일반적인 단순 회귀입니다 . 참고 본래 3 차원 초평면의 하위 - 이제 이차원 라인이 감소된다. 계수 은 에서 선 절단의 절편에 해당합니다 .x11
yi=β1i+β2x2i+ui
X, Y<Y,X>β1x2i=0
또한 상수 가 포함 된 경우 을 통과 함을 알 수 있습니다 . 상수를 빼면 회귀 초평면은 항상 통과합니다 . 의심 할 여지가 없습니다. 이것은 : 도출 할 때 나중에 볼 수 있듯이 여러 차원으로 일반화됩니다 .
는 정의 당 전체 순위가
있으므로 이므로 인터셉트를 생략하면 회귀가 원점을 통과합니다.<0,β1><0,0>βX y - X β = 0
(X′X)β=X′y⟹(X′X)β−X′y=0⟹X′(y−Xβ)=0.
Xy−Xβ=0
( 편집이 : 난 그냥 두 번째 질문이 상수의 포함 또는 제외를 regading 정확히 반대가 작성한 것을 깨달았다 그러나, 나는 이미 여기에 솔루션을 고안하고 내가 그 일에 대한 잘못된 생각하면 내가 그렇군요.. )
회귀의 행렬 표현은 처음에는 매우 혼란 스러울 수 있지만 더 복잡한 대수를 도출 할 때 결국 단순화합니다. 이것이 조금 도움이되기를 바랍니다.