n 간격을 균일하게 무작위로 그리기, 하나 이상의 간격이 다른 간격과 겹칠 확률


17

[ 0 , 1 ] 에서 nn 간격을 무작위로 그립니다 . 여기서 각 끝점 A, B는 [ 0 , 1 ] 사이의 균일 한 분포에서 선택됩니다 .[0,1][0,1]

하나 이상의 간격이 다른 간격과 겹칠 확률은 얼마입니까?


마지막으로 그려진 A nAn 이 이전에 그려진 모든 A 의 최소값보다 작을 A확률과 마지막 B nBn 이 이전에 그려진 모든 B 의 최대 값보다 클 확률을 볼 수 B있습니다. 도움이 될 것입니다. 그런 다음 마지막 것이 아니라 어떤 것이 필요하다는 사실을 설명 할 확률을 높이십시오 . (나는 그것을 통해 작업에 시간이 없어,하지만 재미있는 작은 문제처럼 보인다 행운을 빕니다.!)
S. Kolassa - 분석 재개 모니카

(1) 대답이 분포에 의존하지 않고 (연속적 임) (2) n > 1에 대해 일정 하다는 것이 다소 놀랍 습니다. n>1
whuber

1
이것이 어떻게 N 번째 간격 construted : ⅰ) 균등 임의로 두 숫자를 그리는 [0,1], ii) 상기 하나의 작은하자 N 과 큰 하나 B N ? AnBn
ekvall

답변:


5

이 게시물은 질문에 대한 답변을 제공하고 정답을 입증하기위한 부분적인 진행 상황을 간략하게 설명합니다.


들면 N = 1 , 대답은 사소하다 1 . 모든 큰 들어 N , 그것은 (놀랍게도) 항상 2 / 3 .n=11n2/3

먼저 질문에 일반화 될 수 있음을 관찰, 이유를 어떤 연속 분포 F (균일 한 분포의 장소에). 프로세스는 이에 의해 N 개의 간격은 도면에 양 생성되어 2 N IID variates X 1 , X 2 , ... , X 2 N 에서 F 및 형성 간격Fn2nX1,X2,,X2nF

[ 최소 ( X 1 , X 2 ) , 최대 ( X 1 , X 2 ) ] , , [ 최소 ( X 2 n - 1 , X 2 n ) , 최대 ( X 2 n - 1 , X 2 n ) ] .

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

X i 의 모든 2 n 은 독립적이기 때문에 서로 교환 가능합니다. 이것은 우리가 무작위로 모든 것을 순열한다면 해결책이 동일하다는 것을 의미합니다. 그러므로 X i 를 정렬하여 얻은 순서 통계를 조건으로하자 :2nXiXi

X ( 1 ) < X ( 2 ) < < X ( 2 n )

X(1)<X(2)<<X(2n)

(여기서 F 는 연속적 이므로 두 개가 같을 가능성은 없습니다.) N 개의 구간은 랜덤 순열을 선택하여 형성된다 σ S 2 N을 과 쌍들을 연결FnσS2n

[ ( X σ ( 1 ) , X σ ( 2 ) ) , 최대 ( X σ ( 1 ) , X σ ( 2 ) ) ] , ... , [ ( X σ ( 2 N - 1 ) , X σ ( 2 n ) ) , 최대 ( X σ ( 2N - 1 ) , X σ ( 2 N ) )].

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

이러한 중첩 두인지 여부의 값에 의존하지 않는 X ( I ) ,X(i) 겹쳐진 어떤 의한 단조 변환 보존되기 때문에 F : RR을 그 송신 같은 변환이있다 X ( I ) . 따라서 일반성을 잃지 않으면 서 우리는 X ( i ) = i를 취할 수 있으며 질문은 다음과 같이됩니다.f:RRX(i)iX(i)=i

집합 { 1 , 2 , , 2 n - 1 , 2 n }n 개의 분리 된 더블 톤 으로 분할합니다 . r 1 > l 2r 2 > l 1 일{ l 1 , r 1 }{ l 2 , r 2 } ( l i < r i 포함 ) 중 두 개가 겹칩니다.{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir1>l2r2>l1. 파티션의 요소 중 하나 이상이 다른 모든 요소와 겹칠 때 파티션이 "양호"하다고 가정합니다 (그렇지 않으면 "나쁜"). n 의 함수로서 좋은 파티션의 비율은 얼마입니까?n

예를 들어, n = 2 경우를 고려하십시오 . 세 개의 파티션이 있습니다.n=2

{ { 1 , 2 } , { 3 , 4 } } , { { 1 , 4 } , { 2 , 3 } } , { { 1 , 3 } , { 2 , 4 } } ,  

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

그 중 두 가지 좋은 것 (두 번째와 세 번째)은 빨간색으로 표시됩니다. 따라서 경우에 응답 N = 22 / 3 .n=22/3

이러한 파티션 { { l i , r i } ,숫자 라인에점 { 1 , 2 , , 2 n } 을플롯하고각 l i r i 사이에 선 세그먼트를 그려서시각적으로 겹치는 부분을 해결하기 위해포인트를약간 상쇄함으로써 i = 1 , 2 , , n } . 다음은 동일한 색상으로 동일한 순서로 이전 세 파티션의 도표입니다.{{li,ri},i=1,2,,n}{1,2,,2n}liri

Figure 1

From now on, in order to fit such plots easily in this format, I will turn them sideways. For instance, here are the 1515 partitions for n=3n=3, once again with the good ones colored red:

Figure 2

Ten are good, so the answer for n=3n=3 is 10/15=2/310/15=2/3.

첫 번째 흥미로운 상황은 n = 4 일 때 발생합니다 . 이제, 처음으로, 스팬 간격의 조합 가능하다 (1)2 N 다른 교차 그들 중 어느 하나 일없이. 예는 { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } 입니다. 선분의 결합은 1 에서 8 까지 끊어지지 않습니다.n=412n{{1,3},{2,5},{4,7},{6,8}}18 but this is not a good partition. Nevertheless, 7070 of the 105105 partitions are good and the proportion remains 2/32/3.


The number of partitions increases rapidly with nn: it equals 1352n1=(2n)!/(2nn!)1352n1=(2n)!/(2nn!). Exhaustive enumeration of all possibilities through n=7n=7 continues to yield 2/32/3 as the answer. Monte-Carlo simulations through n=100n=100 (using 1000010000 iterations in each) show no significant deviations from 2/32/3.

I am convinced there is a clever, simple way to demonstrate there is always a 2:12:1 ratio of good to bad partitions, but I have not found one. A proof is available through careful integration (using the original uniform distribution of the XiXi), but it is rather involved and unenlightening.


Very cool. I have a hard time following what it means to "condition on the order statistics", would it be possible to add a line of intuition? Seems like a useful technique. I understand up to that the Xi are exchangeable, indeed even iid, that that this allows us to consider any permutation.
ekvall

1
@Student To "condition on" means to say, let's temporarily hold these values fixed and consider what we can learn from that. Later, we will let those values vary (according to their probability distribution). In this case, once we find that the answer is 2/3 regardless of the fixed values of the order statistics, then we no longer have to carry out the second step of varying the order statistics. Mathematically, the order stats are a vector-valued variable X and the indicator of being good is Y, so E(Y)=E(E(Y|X))=E(2/3)=2/3.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.