누군가가 면접에서이 질문을하고 공동 분포가 항상 가우시안이라고 답했습니다. 나는 항상 평균과 분산 및 공분산으로 이변 량 가우시안을 작성할 수 있다고 생각했습니다. 두 가우시안의 공동 확률이 가우시안이 아닌 경우가 있는지 궁금합니다.
누군가가 면접에서이 질문을하고 공동 분포가 항상 가우시안이라고 답했습니다. 나는 항상 평균과 분산 및 공분산으로 이변 량 가우시안을 작성할 수 있다고 생각했습니다. 두 가우시안의 공동 확률이 가우시안이 아닌 경우가 있는지 궁금합니다.
답변:
이변 량 정규 분포는 예외 가 아니라 규칙입니다!
정규 한계를 갖는 "거의 모든"관절 분포가 이변 량 정규 분포 가 아님 을 인식하는 것이 중요합니다 . 즉, 이변 량 법선이 아닌 법선 한계 값을 갖는 관절 분포가 어떻게 든 "병리학 적"이라는 일반적인 관점은 약간 잘못된 것입니다.
다변량 법선은 선형 변환에서의 안정성으로 인해 매우 중요하므로 응용 분야에서 많은 관심을 받고 있습니다.
예
몇 가지 예제로 시작하는 것이 좋습니다. 아래 그림은 여섯 개 이변 량 분포의 히트 맵을 포함 하는 모든 표준 정규 marginals이있는이. 맨 위 줄의 왼쪽과 가운데는 이변 량 법선이고 나머지는 그렇지 않습니다 (명백해야 함). 아래에 더 자세히 설명되어 있습니다.
copulas의 베어 본
의존성의 속성은 종종 copulas를 사용하여 효율적으로 분석됩니다 . 이변 접합부는 단위 제곱에 대한 확률 분포 단지 공상 이름 로 균일 marginals.
가 이변 량의 copula 라고 가정하십시오 . 그런 다음 위에서 바로 , 및 입니다.C ( u , 1 ) = u C ( 1 , v ) = v
이변 량 copula의 간단한 변형으로 미리 지정된 한계 값을 갖는 유클리드 평면에 이변 량 랜덤 변수를 생성 할 수 있습니다 . 하자 및 랜덤 변수 쌍에 대한 한계를 정하는 분포 . 그런 다음 가 이변 량 copula이면 는 한계 값 및 가있는 이변 량 분포 함수입니다 . 이 마지막 사실을 보려면 대해서도 같은 주장이 적용됩니다 .F 2 ( X , Y ) C ( u , v ) F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) ) F 1 F 2
연속 및 경우 Sklar 정리 는 대화를 암시하는 고유성을 암시합니다. 즉, 연속 마진이 , 인 이변 량 분포 가 주어지면 해당하는 copula는 고유합니다 (적절한 범위 공간에서).
이변 량 법선은 예외적입니다
Sklar의 정리는 (실질적으로) 이변 량 정규 분포를 생성하는 하나의 copula 만 있다고 말합니다. 이것은, 적절하게 상기라는 가우시안 접합부 의 밀도가 여기서 분자는 및 에서 평가 된 상관 관계 갖는 이변 량 정규 분포입니다. .
그러나, 거기에 많은 다른 copulas의은과 모든 그들이다 정상 marginals와 이변 량 분포를 줄 것이다 없습니다 이전 섹션에 설명 된 변환을 사용하여 이변 량 정상을.
예제에 대한 세부 사항
참고한다면 그 오전이며 , 임의의 밀도와 접합부 의 변화 하에서 표준 정규 marginals와 해당 이변 밀도 는
위의 방정식에서 가우스 copula를 적용하여 2 변량 정규 밀도를 회복합니다. 그러나 다른 선택에 대해서는 그렇지 않습니다.
그림의 예는 다음과 같이 구성되었습니다 (한 번에 한 열씩 각 행을 이동).
library(copula)
kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE)))
# force normal margins
evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1)))
contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
다변량 법선 벡터의 각 요소는 그 자체로 정규 분포되어 있으며 그 평균과 분산을 추론 할 수 있습니다. 그러나 두 개의 구 아시안 랜덤 변수가 함께 정규 분포되어 있다는 것은 사실이 아닙니다. 예를 들면 다음과 같습니다.
편집 : 점 질량 인 임의 변수가 인 정규 분포 변수로 생각할 수 있다는 의견에 동의하여 예제를 변경하고 있습니다.
하자 및하자 A는 랜덤 변수. 즉, 각각 확률이 입니다.
먼저 에 표준 정규 분포가 있음을 보여줍니다 . 으로 총 확률의 법칙 ,
다음,
여기서 는 표준 일반 CDF 입니다. 비슷하게,
따라서,
따라서 의 CDF 는 이므로 입니다.
이제 우리는 가 공동으로 정규 분포되지 않음 을 보여줍니다 . @cardinal이 지적했듯이, 다변량 법선의 한 특성은 요소의 모든 선형 조합이 정규 분포한다는 것입니다. 에는이 속성이 없습니다.
따라서 는 랜덤 변수와 0의 점 질량 의 혼합물 이므로 정규 분포를 사용할 수 없습니다.
다음 게시물에는 주요 아이디어를 제공하고 시작하기위한 증명 개요 가 포함되어 있습니다 .
하자 두 개의 독립적 인 가우시안 랜덤 변수 일 및하자 수
각 이지만 둘 다 동일한 독립 r.vs의 선형 조합이므로 공동으로 의존합니다.
정의 r.vs 쌍은 독립 정규 r.vs 의 선형 조합 로 쓸 수있는 경우 이변 량 정규 분포라고합니다 .
보조 정리 하면 이변 량 가우시안 후 그 임의의 다른 선형 조합들은 다시 정상 랜덤 변수이다.
증거 . 사소한, 다른 사람을 화나게하지 않기 위해 건너 ped
속성 가 서로 관련이 없으면 독립적이며 그 반대도 마찬가지입니다.
분포
가정 이전 만의 그들이 긍정적 인 변화가 제로가 단순에 대한 의미 가정하자 같은 가우스 r.vs 있습니다.
가 에 의해 확장 된 부분 공간 인 경우 및 입니다.
과 는 선형 조합 이므로 도 동일합니다. 그것들은 공동 가우시안이고 상관되지 않으며 (증명) 독립적입니다.
분해 는
그런 다음
두 개의 일 변량 가우스 랜덤 변수 는 조건부 와 도 가우시안입니다.