고전 다변량 선형 회귀 설정에서는 다음과 같은 모델이 있습니다.
와이= Xβ+ ϵ
여기서 는 독립 변수를 나타내고 Y 는 다중 응답 변수를 나타내며 ϵ 는 iid Gaussian 노이즈 항입니다. 잡음의 평균은 0이며 반응 변수간에 상관 될 수 있습니다. 가중치에 대한 최대 우도 솔루션은 노이즈 제곱에 관계없이 최소 제곱 솔루션과 같습니다 [1] [2] :엑스와이ϵ
β^=( X티엑스)− 1엑스티와이
이는 각 반응 변수에 대해 개별 회귀 문제를 독립적으로 해결하는 것과 같습니다. 이는 사실로부터 알 수있는 의 열째 β (대한 가중치를 포함하는 I 번째 출력 변수) 곱한 수 ( X T X ) - 1 X T 바이 I 의 열째 Y를 값을 (포함 I 번째 응답 변수).나는β^나는( X티엑스)− 1엑스티나는와이나는
그러나 다변량 선형 회귀는 통계적 추론 절차가 다중 반응 변수 사이의 상관 관계를 설명하기 때문에 개별 회귀 문제를 개별적으로 해결하는 것과 다릅니다 (예 : [2], [3], [4] 참조). 예를 들어 노이즈 공분산 행렬은 샘플링 분포, 테스트 통계 및 구간 추정치에 나타납니다.
각 반응 변수에 고유 한 공변량 세트를 허용하면 또 다른 차이점이 나타납니다.
와이나는=X나는β나는+ϵ나는
여기서 는 i 번째 응답 변수를 나타내고, X i 및 ϵ i 는 해당 공변량 세트와 노이즈 항을 나타냅니다. 위와 같이 노이즈 항은 응답 변수간에 상관 될 수 있습니다. 이 설정에는 최소 제곱보다 효율적인 추정기가 있으며 각 반응 변수에 대한 개별 회귀 문제를 해결하는 것으로 줄일 수 없습니다. 예를 들어 [1]을 참조하십시오.와이나는나는엑스나는ϵ나는
참고 문헌
- 젤너 (1962) . 관련이없는 것처럼 보이는 회귀를 추정하고 집계 편향을 테스트하는 효율적인 방법입니다.
- Helwig (2017) . 다변량 선형 회귀 [슬라이드]
- 폭스와 바이스 버그 (2011) . R의 다변량 선형 모형. [부록 : 적용 회귀에 대한 R 동반자]
- 마이 트라 (2013) . 다변량 선형 회귀 모형. [슬라이드]