모자 매트릭스의 중요성은 무엇입니까?


10

회귀 분석에서 모자 행렬 의 중요성은 무엇입니까 ?H=X(XX)1X

더 쉬운 계산만을위한 것입니까?


또한 좀 더 구체적으로 설명해 주시겠습니까?
Steve S

@SteveS 사실 우리가 왜 모자 매트릭스가 필요한지 알고 싶습니까?
사용자 31466

매트릭스에 특수 이름 / 기호 (예 : "모자 매트릭스", " H ") 가 필요한 이유를 묻고 있습니까, 아니면 오른쪽에서 매트릭스 제품의 중요성에 대해 더 궁금하십니까?
Steve S

답변:


14

선형 회귀 연구에서 기본 시작점은 데이터 생성 프로세스입니다. y= XB + u 여기서 및 결정적입니다. 최소 제곱 기준 번 발견 추정기 최소화 후 에 대한 , 즉 . 초기 공식에서 추정값을 연결 하면 데이터 생성 프로세스의 선형 모델로 을 . 이제, 하나에 대한 추정을 대체 할 수 및 취득uN(0,σ2I)XB^BB^=(XX)1Xyy^=XB^B^y^=X(XX)1Xy.

따라서 는 실제로 투영 행렬입니다. 모든 변수를 사용한다고 가정하십시오 . 변수는 벡터이며 공간에 걸쳐 있습니다. 따라서 에 를 곱하면 관측 된 값을 에서 의 변수가 공간에 투영합니다 . 이것은 대한 추정치를 제공 하며 이것이 모자 매트릭스라고 불리는 이유와 그것이 중요한 이유입니다. 결국 선형 회귀는 투영에 지나지 않으며 투영 행렬을 사용하여 대한 추정값 만 계산할 수는 없습니다.H=X(XX)1XXHyyXyy 에도 실제로 정규 분포인지 확인할 수 있습니다.u

인터넷에서이 멋진 그림을 발견했으며이 투영을 시각화했습니다. , 참고하시기 바랍니다 대신 사용 . 또한, 그림은 오차항의 벡터가 투영과 직교하므로 의 추정치와 상관 관계가 없음을 강조합니다.βBy

여기에 이미지 설명을 입력하십시오


5

모자 매트릭스는 몇 가지 이유로 매우 유용합니다.

  1. 대신에 얻습니다. 여기서 는 모자 행렬입니다. 이것은 가 관찰 된 값의 선형 매핑 이라는 것을 알려줍니다 .y^=Zβ^y^=PyPy^
  2. 모자 행렬 에서 잔차 쉽게 계산할 수 있습니다. 우리가 볼 .Pϵ^ϵ^=yy^=yPy=(InP)y

0

b가 A의 열 공간에 있지 않은 Ax = b에 대한 "가장 가까운"솔루션을 찾는 것 이상입니다. b를 열 공간에 투영하고 Ax (hat) = p를 구합니다. 여기서 p는 b의 투영입니다. 열 공간.


1
이 모든 것은 계산하지 않고도 수행 할 수 있습니다 . H
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.