이 주장은 이 질문 에 대한 최고의 응답으로 제기되었습니다 . 나는 '왜'질문이 새로운 스레드를 보장하기에 충분히 다르다고 생각합니다. 인터넷 검색의 "완전한 연관성 측정"으로 인한 조회수는 없었으며 해당 문구가 무엇을 의미하는지 잘 모르겠습니다.
이 주장은 이 질문 에 대한 최고의 응답으로 제기되었습니다 . 나는 '왜'질문이 새로운 스레드를 보장하기에 충분히 다르다고 생각합니다. 인터넷 검색의 "완전한 연관성 측정"으로 인한 조회수는 없었으며 해당 문구가 무엇을 의미하는지 잘 모르겠습니다.
답변:
다변량 분포에서 "연관 측정"을 이해 하여 값을 임의로 크기를 조정하고 최근에 변경했을 때 동일하게 유지되는 모든 속성 으로 구성하는 것이 가장 좋습니다 . 그렇게하면 평균과 분산을 이론적으로 허용 가능한 값으로 변경할 수 있습니다 (분산은 양수 여야하며, 평균은 무엇이든 가능함).
상관 계수 ( "피어슨 ") 그런 다음 다변량 정규 분포 를 완전히 결정합니다.이를 확인하는 한 가지 방법은 밀도 함수 또는 특성 함수에 대한 공식과 같은 공식 정의를 보는 것입니다. 만 평균, 분산 및 공분산 되지만 공분산 및 상관 관계는 차이를 알면 서로 추론됩니다.
다변량 정규군은이 특성을 즐기는 유일한 분포 군이 아닙니다. 예를 들어, 임의의 다변량 t 분포 (자유도 초과)는 잘 정의 된 상관 관계 행렬을 가지며 처음 두 모멘트에 의해 완전히 결정됩니다.
변형은 Pearson 상관 관계가 완전히 눈에 띄지 않는 방식으로 연관 될 수 있습니다.
다변량 법선에서, Pearson 상관 관계는 가능한 유일한 연관성이. 그러나 다른 분포 (정상 마진이있는 분포)의 경우 상관없이 연관 될 수 있습니다. 다음은 3 개의 정규 랜덤 변량 (x, y 및 x, z)에 대한 몇 가지 도표입니다. 그들은 매우 관련이 있습니다 (당신이 나에게 가치를 말하면-변형, 다른 두 가지를 말해 줄 게요 나는 당신에게 말할 수 있습니다 )이지만 모두 서로 관련이 없습니다.
관련이 있지만 관련이없는 변형의 또 다른 예는 다음과 같습니다.
(여기서는 데이터를 사용하여 설명하고 있지만 배포에 대한 기본 사항이 제시되고 있습니다.)
변이가 상관되어 있더라도 피어슨 상관 관계는 일반적으로 어떻게 . 동일한 Pearson 상관 관계를 갖는 매우 다른 형태의 연관성을 얻을 수 있습니다 (그러나 변칙이 다변량 정규 인 경우 표준화 된 변이가 얼마나 관련되어 있는지 정확하게 말할 수있는 상관 관계).
따라서 Pearson 상관 관계는 변이가 연관되는 방식을 "고갈"하지 않습니다. 연관성이 있지만 연관성이 없거나 연관성이 있지만 매우 뚜렷한 방식으로 연관 될 수 있습니다. [상관 관계에 의해 완전히 포착되지 않는 다양한 방식이 발생할 수 있지만 그 중 하나가 발생하면 다변량 법선을 가질 수 없습니다. 그러나 내 토론에서 아무것도 이것을 암시하는 것은 아닙니다. 제목 인용 부호가 제안하는 것처럼 보이지만 가능한 연관성을 정의합니다.)
(다변량 연관을 해결하는 일반적인 방법은 copulas를 사용하는 것입니다. copulas와 관련된 많은 질문이 사이트에 있습니다. 일부는 도움이 될 수 있습니다)