답변:
공분산 행렬의 가장 기본적인 사용은 회귀 추정의 표준 오차를 얻는 것입니다. 연구원이 개별 회귀 모수 자체의 표준 오차에만 관심이 있다면, 대각선의 제곱근을 취하여 개별 표준 오차를 얻을 수 있습니다.
그러나 회귀 모수의 선형 조합에 관심이있는 경우가 종종 있습니다. 예를 들어 특정 그룹에 대한 표시기 변수가있는 경우 그룹 평균에 관심이있을 수 있습니다.
.
그런 다음 해당 그룹의 추정 평균에 대한 표준 오차를 찾으려면
,
여기서 는 대비의 벡터이고 는 공분산 행렬입니다. 우리의 경우에, 우리가 단지 가산 공변량 "GRP"를 가지고 있다면, ( 절편에 대한 군에 속하는 경우).
또한 공분산 행렬 (또는 공분산 행렬에서 고유하게 식별되지만 그 반대의 상관 관계는 아닌 상관 관계 행렬)은 특정 모델 진단에 매우 유용 할 수 있습니다. 두 변수가 서로 밀접하게 관련되어있는 경우이를 고려하는 한 가지 방법은 모델이 어떤 변수가 효과를 담당하는지 파악하는 데 어려움을 겪고 있다는 것입니다 (매우 밀접하게 관련되어 있기 때문). 이는 예측 모델에 사용할 공변량의 하위 집합을 선택하는 등 다양한 경우에 유용 할 수 있습니다. 두 변수가 서로 밀접하게 관련되어 있으면 예측 모델에서 두 변수 중 하나만 사용할 수 있습니다.
회귀 계수에는 두 가지 "종류"가 있습니다.
공분산이 무엇을 의미하는지 생각해보십시오. 두 개의 임의 변수 와 취하십시오 . 경우높은 절대 값 를 그릴 때마다 같은 방향으로 큰 절대 값 를 그릴 것으로 예상 할 수 있습니다 . 여기서 "높음" 은 주석에서 지적한 바와 같이 및 의 변동량에 상대적 입니다.
두 회귀 계수의 (예상) 공분산은의 공분산이다 추정치 , . 추정 계수 과 사이의 공분산 이 높으면 이 높은 모든 샘플에서 도 높을 것으로 예상 할 수 있습니다 . 보다 베이지안적인 의미에서 에는 에 대한 정보가 포함 됩니다.b 1 b 2 b 1 b 2 b 1 b 2
"높음"은 상대적입니다. 여기서 " 이 높음"은 " 이 표준 오류에 비해 높고"공분산이 "높음"이면 "표준 오류의 곱에 비해 높음"을 의미합니다. 이러한 해석 적 딸꾹질을 부드럽게하는 한 가지 방법은 각 회귀 입력을 표준 편차 (또는 경우에 따라 2 개의 표준 편차)로 나누어서 각 회귀 입력을 표준화하는 것입니다.b 1
이 사이트에 한 사용자가 설명 "퍼지의 비트,"그러나 나는 전적으로 동의하지 않습니다. 우선,이 해석을 사용하여 베이지안 회귀에서 유익한 사전 정보를 얻을 수 있습니다.
이것이 실제로 사용되는 것에 관해서는 Cliff AB의 대답이 좋은 요약입니다.