두 정규 분포의 랜덤 변수 사이의 유클리드 거리 분포는 무엇입니까?


41

정확한 위치를 알 수 없지만 알려진 모수를 갖는 정규 분포 (예 : 및 에 따라 분포 된 두 개의 객체가 있다고 가정합니다 . 위치가 좌표 에 대한 분포 (즉, 및 는 각각 및 대해 예상되는 좌표를 포함하는 벡터 의해 설명되도록 양쪽이 변량 법선이라고 가정 할 수 있습니다 . 또한 객체가 독립적이라고 가정합니다.aN(m,s)bN(v,t))(x,y)mv(x,y)ab

이 두 물체 사이의 제곱 유클리드 거리 분포가 알려진 모수 분포인지 아는 사람이 있습니까? 또는이 기능에 대한 PDF / CDF를 분석적으로 파생시키는 방법은 무엇입니까?


4
네 개의 좌표가 서로 관련이없는 경우 중심이 아닌 카이 제곱 분포의 배수를 구해야합니다. 그렇지 않으면 결과가 훨씬 더 복잡해 보입니다.
whuber

@whuber 결과 중심이 아닌 카이 제곱 분포의 매개 변수가 객체의 매개 변수와 어떤 관련이 있는지에 관해 제공 할 수있는 세부 사항 / 포인터 a, b는 환상적입니다.
Nick

4
@ Wikipedia 기사 의 처음 몇 단락은 세부 사항을 제공합니다. 특성 함수를 보면 모든 분산이 동일하지 않거나 상관 관계가있는 경우 유사한 결과를 사용할 수 없음을 확인할 수 있습니다.
whuber

@Nick, 명확히하기 위해 와 는 모두 ? abR2
mpiktas

1
@Nick, 와 가 함께 정상이라면, 그 차이는 도 정상입니다. 그런 다음 문제는 임의의 법선 벡터의 분포를 찾는 것입니다. 인터넷 검색이 링크를 찾았습니다 . 이 백서는 매우 특별한 경우에 귀하의 문제와 일치하는 훨씬 더 복잡한 문제를 설명합니다. 이것은 귀하의 질문에 대한 명확한 답변이 있기를 희망합니다. 참조는 검색 할 추가 아이디어를 제공 할 수 있습니다. abab
mpiktas

답변:


24

이 질문에 대한 답 은 Mathai and Provost (1992, Marcel Dekker, Inc.)의 랜덤 변수의 2 차 형태 책에서 찾을 수 있습니다 .

주석에서 알 수 있듯이 의 분포를 찾아야합니다. 여기서 는 평균 및 공분산 행렬 갖는 이변 량 정규 분포를 따릅니다 . 이것은 이변 량 랜덤 변수 의 2 차 형태입니다 .Q=z12+z22z=abμΣz

간단히 말하면, 및 차원 경우에 대한 좋은 일반적인 결과 는 모멘트 생성 함수가 여기서 는 의 고유 값 이고 는 의 선형 함수입니다 . 위에 인용 된 책에서 정리 3.2a.2 (42 페이지)를 참조하십시오 (여기서 는 단수 라고 가정합니다 ). 또 다른 유용한 표현 3.1a.1 (29 페이지)는 곳z N p ( μ , Σ ) Q = p j = 1 z 2 j E ( e t Q ) = e t p j = 1 b 2 j λ jpzNp(μ,Σ)

Q=j=1pzj2
λ(1),...,λP는Σ를BμΣQ=PΣJ=1λJ(UJ+BJ)2u1,,upN(0
E(etQ)=etj=1pbj2λj12tλjj=1p(12tλj)1/2
λ1,,λpΣbμΣ
Q=j=1pλj(uj+bj)2
u1,,up 는 iid 입니다.N(0,1)

이 책의 4 장 전체는 밀도와 분포 함수의 표현과 계산에 관한 것으로, 이는 사소한 것이 아닙니다. 나는이 책에 외견 상으로는 친숙하지만 모든 일반적인 표현은 무한한 시리즈 확장이라는 점에서 인상적이다.

따라서 어떤 식 으로든 질문에 대한 대답은 그렇습니다. 두 개의 이변 량 법선 벡터 사이의 제곱 유클리드 거리의 분포는 네 개의 매개 변수 의해 매개 변수화 된 알려진 (그리고 잘 연구 된) 분포 클래스에 및 . 그러나 표준 교과서 에서이 배포판을 찾지 못할 것이라고 확신합니다.b 1 , b 2Rλ1,λ2>0b1,b2R

또한 와 가 독립적 일 필요는 없습니다. 관절 정규성이 충분하면 (독립적이고 각 정규 인 경우 자동 임) 차이 는 정규 분포를 따릅니다.b a - babab


1
참조 주셔서 감사합니다, 나는 책을 발견하고 천천히 그것을 통해 방법을 만들기 위해 노력하고 있습니다
Nick

@NRH 나는 대칭 경우 ( )에서 MGF를 통해 직접 작업했습니다. 여기서 이고 요약에서 대신 입니다. 시뮬레이션은 첫 번째 순간을 확인합니다. 이것이 당신이 언급 한 "선형 함수"일 수도 있고 이것은 대칭적인 경우에 특이 할 수도 있지만, 오류가있을 때 지적 할 것이라고 생각했습니다. p = 2 b 2 j λ j μ 2 jλj=σ2p=2bj2λjμj2
kyle

실제로 의 정의 에 따라 지수의 분자 는 대칭 (공통 분산이있는 독립적 인 차원) 경우 로 줄어 듭니다 . μ 2 jbjμj2
kyle

7

먼저 차분 벡터 의 이변 량 분포를 정의합니다. 간단히 ; 이것으로부터 다음 변수 불확실성 전파 , 블록을 포함하는 대각 행렬 및 코비안 .Σ d = Σ 1 + Σ 2 Σ d = J Σ 12 J T Σ 12 = [ Σ 1μd=μ1μ2Σd=Σ1+Σ2 Σd=JΣ12JTJ=[ + I , I ]Σ12=[Σ1Σ2]J=[+I,I]

둘째, 차이 벡터 길이의 분포 또는 원점으로부터의 방사 거리 ( Hoyt distribution )를 찾으십시오 .

극좌표 (반지름 및 각도)로 재 작성된 불균형 분산을 갖는 이변 량 상관 정규 랜덤 변수에서 실제 평균 주위의 반경은 Hoyt 분포를 따릅니다. pdf와 cdf는 닫힌 형태로 정의되며, cdf ^ -1을 구하기 위해 수치 적 루트 찾기가 사용됩니다. 상관이 0이고 분산이 동일한 경우 레일리 분포로 감소합니다.

Ballistipedia에서 편향된 차이 (이동 된 원점)를 허용하면보다 일반적인 분포가 발생합니다 . xy 좌표의 분포와 결과적인 방사형 오차


2
+1이지만,이 질문이 당신의 인물이 "일반 사례"라고 부르는 것을 다루는 것이 가치가 있다고 생각합니다.
amoeba는 Reinstate Monica가

1

왜 테스트하지 않습니까?

set.seed(347)
x <- rnorm(10000)
y <- rnorm(10000)
x2 <- rnorm(10000)
y2 <- rnorm(10000)

qdf <- data.frame(x,y,x2,y2)
qdf <- data.frame(qdf,(x-x2)^2+(y-y2)^2)
colnames(qdf)[5] <- "euclid" 

plot(c(x,y),c(x2,y2))
plot(qdf$euclid)
hist(qdf$euclid) 
plot(dentist(qdf$euclid))

줄거리 1 줄거리 2 줄거리 3 줄거리 4


2
원래 질문에 대한 whubers 의견은 이미 분산이 동일하고 변수가 상관되지 않은 경우 어떻게 보일지 언급했습니다. 아마도 이것이 아닌 경우에 대한 예를 제공하는 것이 더 깨달을 것입니다.
Andy W

그러한 예를 들어 줄 수 있습니까?
Brandon Bertelsen

상관 관계가 있거나 분산이 다른 x 및 y 값을 생성하기 만하면됩니다. 코드에서 그대로 다른 분산을 수행 할 수 있습니다. MASS 패키지에서 mvrnorm을 사용하여 지정된 공분산 행렬에서 값을 생성 할 수 있습니다. 또한 위의 코드에서 "dentist"기능이 무엇인지 확실하지 않습니다. 아마도 "밀도"여야합니다.
Andy W

1
그것은 왜 이것이 사실인지 (그리고 분산 / 공분산을 조작하는 것이 분포를 어떻게 바꾸는 지) 알기 위해 수학을 통해 작업하는 것을 깨달은 것 같습니다. 왜 이것이 whuber에 의해 언급 된 특징적인 기능을 보는 것만 큼이 분명하지 않습니다. 랜덤 변수의 더하기, 빼기 및 곱하기에 대한 규칙을 이해하면 그 이유를 이해하는 데 도움이 될 것 같습니다.
Andy W
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.