균일하게 분포 된 두 점 사이의 예상 거리를 찾는 방법은 무엇입니까?


9

좌표를 정의하면 (X1,Y1)(X2,Y2) 어디

엑스1,엑스2대학교(0,30) 과 와이1,와이2대학교(0,40).

그들 사이의 거리의 예상 값을 어떻게 찾을 수 있습니까?

거리는 다음과 같이 계산되기 때문에 생각하고있었습니다.(엑스1엑스2)2+(와이1와이2)2) 기대 값은 (1/30+1/30)2+(1/40+1/40)2?


LaTeX 코드가 올바르게 렌더링되지 않았습니다. 내 수정 당신의 의도를 희망
피터 Flom에

거의 끝났지 만 결국에는 많은 도움을주었습니다.
Mathlete

2
수학 사이트의 해당 질문 : 사각형의 임의 지점 간 평균 거리 . 관련 질문 : 사각형에서 균일하게 임의의 점이 주어진 임계 값보다 작은 유클리드 거리를 가질 가능성 . (불행히도, 나는 그의 제안에 @whuber를 사용하지 않았습니다. 시간을 좀내어 보려고 노력할 것입니다.)
추기경

1
@cardinal 링크를 이용해 주셔서 감사합니다. 수학 버전은 답을 설명하지는 않지만 답을 제시하지만 한 가지 파생물에 대한 링크를 포함하므로 검토 할 가치가 있습니다.
whuber

답변:


2
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
      catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855

당신이 찾고있는 것을 올바르게 이해하면 도움이 될 것입니다. 임의의 점 사이의 거리를 파악하려고합니다. 누가 X 값은 unif (0,30)에서 생성되고 Y 값은 unif (0,40)에서 생성됩니다. 방금 각 분포에서 백만 개의 RV를 생성 한 다음 x와 y를 바인딩하여 각각에 대한 점을 만듭니다. 그런 다음 점 2와 1 사이의 거리를 점 1,000,000과 999,999 사이의 거리까지 계산했습니다. 평균 거리는 18.35855입니다. 이것이 당신이 찾고 있던 것이 아닌지 알려주세요.


서식을 자유롭게 편집 할 수있었습니다.
curious_cat

2
아마 우연히 아마 가까웠습니다. 진정한 대답은1108(871+960로그(2)+405로그()) = 18.345919. 코드에는 두 가지 문제가 있습니다. (1) 반복은 서로 독립적이지 않습니다. (2) 합리적인 정밀도를 얻으려면 더 빠르도록 코딩되어야합니다. 왜 같이 직접 시뮬레이션을 할 수 없습니다 n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2). 표준 오류를 계산하여 확인할 수 있으므로 약 4 개의 유효 숫자 (단시간 내에)를 얻을 수 있습니다 sd(distance) / sqrt(n).
whuber

@ whuber : 당신의 # 1을 설명 할 수 있습니까? 예를 들어 (Case-I)는 주어진 분포와 계산 된 차이에서 난수 쌍을 그리고 평균을 취했습니다. 대 (Case-II) 나는 한 번에 하나의 숫자를 그리고 마지막 숫자 그리기에 대한 실행 차이를 계산 한 다음 평균을 유지했습니다. Case-I와 Case-II가보고 한 평균이 체계적으로 다릅니 까?
curious_cat

1
@curious_cat 아니요, 평균은 거의 같습니다. 그러나 표준 오차 의 계산은 다릅니다. 평균이 실제 값에 얼마나 가까운 지 추정하려면이 계산이 필요합니다. 보다 복잡한 SE 계산을 수행하는 대신, 문제에서 규정 한대로 서로 완전히 독립적으로 점 쌍을 생성하는 것이 더 간단합니다. (시뮬레이션이 잘못 될 수있는 방법은 너무나 많습니다. 경험을 통해 알 수 있습니다!) 시뮬레이션을 현실과 최대한 비슷하게 만드는 것이 현명합니다.
whuber

@ whuber : 명확히 해 주셔서 감사합니다. 클락이 코드를 더 오래 실행했다면 소수점 이하 자리수가 더 많았 을까요?
curious_cat

16

볼록 세트 내에서 두 개의 독립적이고 균일 한 임의의 점 사이의 예상 거리가 지름의 절반보다 약간 작다는 것은 기하학적으로 문제를 살펴보면 분명 합니다. (두 점이 모퉁이와 같은 극단적 인 영역 내에 위치하는 것이 비교적 드물기 때문에 더 작아야하며, 더 가까운 경우 중심 근처에있게됩니다.)이 사각형의 직경은50이 추론만으로 우리는 그 대답이 25.

정확한 답 은 거리의 확률 가중치 값으로 기대 값을 정의하여 얻습니다. 일반적으로 변의 직사각형을 고려하십시오1λ; 나중에 올바른 크기로 조정합니다λ=40/30 기대 값을 곱하면 30). 이 사각형의 경우 좌표 사용(엑스,와이)균일 확률 밀도는 1λ엑스와이. 이 직사각형 내의 평균 거리는 다음과 같습니다.

0λ010λ01(엑스1엑스2)2+(와이1와이2)21λ엑스1와이11λ엑스2와이2.

기본 통합 방법을 사용하면 간단하지만 쉽지 않습니다. 나는 컴퓨터 대수 시스템 ( Mathematica )을 사용하여 답을 얻었습니다.

[2+2λ521+λ2+6λ21+λ22λ41+λ2+5λ아크 신(λ)+5λ4로그(1+1+λ2λ)]/(30λ2).

존재 1+λ2많은 용어에서 놀랄 일이 아닙니다. 사각형의 지름입니다 (두 점 사이의 가능한 최대 거리). 간단한 평면 도형 내에서 평균 거리를 조사한 적이 있다면 대수의 모양 (아크 신을 포함)도 놀랍지 않습니다. 또한, 존재30 분모가 측면의 직사각형을 포함하는 문제의 세부 사항과 관련이 없습니다 3040: 그것은 보편적 인 상수입니다.)

λ=4/ 계수로 스케일 업 30이 평가는 1108(871+960로그(2)+405로그())18.345919.


상황을보다 깊이 이해하는 한 가지 방법 은 지름을 기준으로 평균 거리를 그리는 것 입니다.1+λ2 다양한 가치의 λ. 극단적 인 값0 또는 훨씬 더 1)에서 직사각형은 기본적으로 1 차원이되고보다 기본적인 통합은 평균 거리가 직경의 1/3로 줄어들어야 함을 나타냅니다. 또한 직사각형의 모양이λ1/λ동일, 결과를 로그 스케일 로 플롯하는 것이 당연합니다.λ대칭이어야합니다. λ=1(정사각형). 여기있어:

음모

이것으로 우리 는 경험 법칙을 배웁니다 : 직사각형 안의 평균 거리는1/30.33 그리고 (대략) 0.37제곱 사각형과 관련된 큰 값과 긴 스키니 (선형) 사각형과 관련된 작은 값으로 이러한 극단 사이의 중간 점은 가로 세로 비율이 다음과 같은 직사각형에 대략적으로 달성됩니다.3:1. 이 규칙을 염두에두고 직사각형을 한 에보고 평균 거리를 두 개의 유효 숫자로 추정 할 수 있습니다 .


"직경"대신 "대각선"이어야합니까? nitpicking 경우 죄송합니다.
curious_cat

@curious_cat 정의에 따르면, 임의의 미터법 공간에서 점 집합의 직경은 두 점 사이의 거리의 최고 값입니다. 직사각형의 경우 대각선 길이입니다.
whuber

감사! 나는 그것을 몰랐다. 나는 순진한 직경의 개념을 사용하고있었습니다.
curious_cat

옆으로 : 주어진 영역의 모든 사각형에 대해 평균 거리가 사각형에 대해 최소화됩니까?
curious_cat

2
이것 의 정신으로 , 나는 당신이 " plane ..."(+1)
추기경
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.