공분산 행렬을 반전시키고 결과 정밀도 행렬에서 적절한 셀을 가져 와서 무작위 변수 간의 부분 상관 관계를 찾을 수 있다고 들었습니다 (이 사실은 http://en.wikipedia.org/wiki/Partial_correlation 에 있지만 증거는 없습니다) .
왜 그런가요?
공분산 행렬을 반전시키고 결과 정밀도 행렬에서 적절한 셀을 가져 와서 무작위 변수 간의 부분 상관 관계를 찾을 수 있다고 들었습니다 (이 사실은 http://en.wikipedia.org/wiki/Partial_correlation 에 있지만 증거는 없습니다) .
왜 그런가요?
답변:
다변량 랜덤 변수 에 비 변성 공분산 행렬 , 모든 실제 선형 조합 세트 형성 기준으로 실제 차원 벡터 공간 및 비 분해성 내적
그 이중 기준 이 내적에 대하여 , 고유의 관계에 의해 정의되고
크로네 커 델타 ( i = j 및 0 인 경우 과 동일) 기타).
의 부분 상관 관계 때문에 이중으로 여기에 관심있는 와 X의 J는 부분 사이의 상관 관계로 얻을 수있다 X 나는 공간으로 투사가 다른 모든 벡터에 의해 스팬 후 남아 (의는 단순히 전화를하자 그 " 잔차 ", X i ∘ ) 및 X j 의 비교 가능한 부분 , 그의 잔류 X j ∘ . 그러나 X는 * 저는 또한 모든 벡터에 직교하는 벡터이며 X I 및 긍정적 내적 갖는 X I 어디서 X X * i 의 음이 아닌 배수 여야하며 X j의 경우에도 마찬가지입니다. 그러므로 우리가 쓰자
양의 실수 번호에 대한 및 λ J를 .
부분 상관은 잔차의 정규화 된 내적이며, 크기 조정에 의해 변경되지 않습니다.
(두 경우 모두 잔차가 0이 아닌지 여부에 관계없이 잔차가 직교 할 때마다 부분 상관 관계는 0이됩니다.)
이중 기본 요소의 내부 제품을 찾아야합니다. 이를 위해 원래 기준 이중 기본 요소를 확장하십시오 .
그런 다음 정의에 따라
의 항등 행렬과 B = ( β i j ) 의 행렬 변화 표기법을 사용하여 행렬 표기법에서
That is, , which is exactly what the Wikipedia article is asserting. The previous formula for the partial correlation gives
Here is a proof with just matrix calculations.
I appreciate the answer by whuber. It is very insightful on the math behind the scene. However, it is still not so trivial how to use his answer to obtain the minus sign in the formula stated in the wikipediaPartial_correlation#Using_matrix_inversion.
To get this minus sign, here is a different proof I found in "Graphical Models Lauriten 1995 Page 130". It is simply done by some matrix calculations.
The key is the following matrix identity:
Write down the covariance matrix as
Let . Similarly, write down as
By the key matrix identity,
We also know that is the covariance matrix of (from Multivariate_normal_distribution#Conditional_distributions). The partial correlation is therefore
Just simple inversion formula of 2-by-2 matrix,
Therefore,
i=j
, then rho_ii V\{X_i, X_i} = -1
, How do we interpret those diagonal elements in the precision matrix?
Note that the sign of the answer actually depends on how you define partial correlation. There is a difference between regressing and on the other variables separately vs. regressing and on the other variables together. Under the second definition, let the correlation between residuals and be . Then the partial correlation of the two (regressing on and vice versa) is .
This explains the confusion in the comments above, as well as on Wikipedia. The second definition is used universally from what I can tell, so there should be a negative sign.
I originally posted an edit to the other answer, but made a mistake - sorry about that!