기다리는 역설을 설명 해주세요


75

몇 년 전 저는 사건을 세는 것이 아니라 측정하는 간격을 측정하여 작동하는 방사선 검출기를 설계했습니다. 비 연속 샘플을 측정 할 때 평균적으로 실제 간격의 절반을 측정한다고 가정했습니다. 그러나 교정 된 소스로 회로를 테스트했을 때 판독 값이 너무 높기 때문에 전체 간격을 측정하고있었습니다.

확률과 통계에 관한 오래된 책에서 "The Waiting Paradox"에 관한 섹션을 발견했습니다. 버스가 15 분마다 버스 정류장에 도착하고 승객이 무작위로 도착하는 예를 제시했으며, 평균 15 분 동안 승객이 평균 대기 할 것이라고 언급했습니다. 나는 예제와 함께 제공된 수학을 이해하고 설명을 계속 찾을 수 없었습니다. 누군가 승객이 전체 간격을 기다리도록 이유를 설명 할 수 있다면 더 잘 수있을 것입니다.


1
제목은 무엇이며 누가 저자입니까? 단어의 예시 단어를 여기에 복사 할 수 있습니까?
Joel Reyes Noche

이것은 나의 전문 분야는 아니지만 OP가 언급 한 역설검사 역설 과 동일 합니까?
Joel Reyes Noche


1
위의 추측에 약간의 지원이있는 것 같습니다. 이 답변에 대한 의견 은 검사 역설을 언급합니다.
Joel Reyes Noche

2
나는 버스가 일정을 따르는 경향이 있기 때문에 비유로 버스를 사용하는 것이 혼란 스럽다고 생각합니다. 빈 택시가 평균 15 분마다 올 때 얼마나 오래 걸릴지 생각해보십시오.
Harvey Motulsky

답변:


48

Glen_b가 지적한 바와 같이, 경우 버스마다 도착 어떠한 불확실성없이 , 우리가 알고 있는 최대 대기 시간은 (15) 분 거리에 있습니다. 우리가 "임의로"도착하면 "평균적으로" 가능한 최대 대기 시간의 절반 을 기다릴 것이라고 생각합니다 . 그리고 가능한 최대 대기 시간은 두 개의 연속 도착 사이의 최대 길이와 같습니다. 대기 시간 W 와 두 개의 연속 버스 도착 R 사이의 최대 길이를 나타내면 다음 과 같이 주장합니다.1515아르 자형

(1)이자형()=12아르 자형=152=7.5

우리는 옳습니다.

그러나 갑자기 확실성이 없어지고 분이 두 버스 도착 사이 의 평균 길이 라고 들었습니다 . 그리고 우리는 "직관적 인 사고의 함정"에 빠지고 "우리는 R 을 기대 값으로 만 바꾸면된다"고 생각합니다.15아르 자형

(2)이자형()=12이자형(아르 자형)=152=7.5잘못된

우리가 틀렸다는 첫 번째 징후는 이 "두 개의 연속 버스 도착 사이의 길이" 가 아니라 " 최대 길이 등"이라는 것입니다. 어쨌든 우리는 E ( R ) 15 입니다.아르 자형이자형(아르 자형)15

방정식 어떻게 도달 했 습니까? "대기 시간은 최대 0 에서 15 까지 수 있습니다 . 어떤 경우에도 동일한 확률로 도착하므로 가능한 모든 대기 시간을 무작위로 동일한 확률로"선택 "합니다. 따라서 두 개의 연속 버스 도착 간 최대 길이의 절반은 내 평균 대기 시간 ". 그리고 우리는 옳습니다.(1)015

그러나 실수로 식 ( 2 ) 에 값 를 삽입하면 더 이상 우리의 행동을 반영하지 않습니다. E ( R ) 대신 15 를 사용하면 , 식 ( 2 ) 는 " 두 개의 연속 버스 도착 사이의 평균 길이보다 작거나 같은 가능한 모든 대기 시간 무작위로 선택하고 동일한 확률로 선택합니다. " 우리의 행동을 변경하지 않은 때문에 실수가있다 - "모든 가능한 대기 시간은 '되나 - 그래서, 균일하게 무작위로 도착하여, 우리는 현실에서 여전히 가능한 모든 대기 시간"무작위로 동일한 확률로 선택 " 하지 에 의해 캡처15(2)15이자형(아르 자형)(2) 우리는 두 개의 연속 버스 도착 사이의 길이 분포의 오른쪽 꼬리를 잊어 버렸습니다. 15

따라서 두 개의 연속 버스 도착 사이의 최대 길이의 예상 값을 계산해야합니다. 이것이 올바른 솔루션입니까?

그렇습니다. 그러나 특정 패러독스는 특정 확률 론적 가정과 함께 진행됩니다. 버스 도착은 벤치 마크 포아송 프로세스에 의해 모델링됩니다. 결과적으로 우리는 두 개의 연속 버스 도착은 지수 분포를 따릅니다. 를 길이로 나타내면

에프()=λ이자형λ,λ=1/15,이자형()=15

지수 분포는 오른쪽으로부터 무한한지지를 받기 때문에 이것은 대략적인 것입니다. 즉, "모든 가능한 대기 시간"을 엄밀히 말하면이 모델링 가정 하에서 최대 및 "무한"까지의 무한대를 포함하지만 소멸 확률이 포함됩니다. .

그러나 지수는 기억이 없습니다. 우리 가 어느 시점에 도착 하든 , 우리 는 이전에 무엇 이건 상관없이 동일한 랜덤 변수에 직면합니다 .

감안 이 확률 / 분배 가정, 어느 시점에서는 길이 기대 값 (안 최대 값)와 같은 확률 분포에 의해 기술 된 "개의 연속적인 버스 도착 간 간격"의 일부 "I가 나는 여기 오전 두 버스 도착 사이의 간격으로 둘러싸여 있습니다. 길이의 일부는 과거와 미래에 있습니다.하지만 얼마나 많은지 알 수있는 방법은 없습니다. 내 평균 대기 시간은 어느 정도입니까? " -대답은 항상 " 15 "입니다. 1515


+1 매우 좋습니다. f λ ( )를 읽어야 합니까? 에프()에프λ()
amoeba

감사. 표기법은 둘 다 다른 것을 나타내는 데 사용됩니다. 내가 쓴 것은 임의의 가변 밀도가있는 스트레스 라인에 있습니다. 왜냐하면 다양한 변형에서 우리는 f 와 같은 것으로 끝날 수 있기 때문입니다. 제안한 것은 밀도의 매개 변수화 된 측면을 강조하는 것입니다. 에프엑스(와이)
Alecos Papadopoulos

80

버스가 "15 분마다"(일정에 따라) 도착하면 (임의로 도착하는) 승객의 평균 대기 시간은 실제로 7.5 분입니다. 15 분 간격으로 균일하게 분산되기 때문입니다.

-

반면에 버스가 시간당 평균 4의 속도 로 무작위로 도착하면 (즉, 포아송 프로세스에 따라) 평균 대기 시간이 훨씬 길어집니다. 실제로 메모리 부족으로 해결할 수 있습니다. 승객의 출발을 출발점으로하고 다음 이벤트 시간은 평균 15 분입니다.

별개의 시간 비유를하겠습니다. I는 "B"(버스) 표지, 14 분 (공정 버스의 전체 부재는 "X"를 표지 중 하나 (15 개)면과 다이 압연하고 상상 30 면체가 존재을하므로 I는 2 라벨 있었다 30면 다이 "B"의면). 그래서 분당 한 번 나는 구르고 버스가 오는지 봅니다. 다이는 기억이 없다. 마지막 "B"이후 롤 수를 알 수 없습니다. 이제 연결되지 않은 이벤트가 발생한다고 상상해보십시오. 개 짖는 소리, 승객이 도착하면 우레 소리가 들립니다. 이제 다음 "B"까지 얼마나 오래 기다려야합니까 (롤 수)?

메모리 부족으로 인해 평균적으로 두 개의 연속 "B"사이의 시간과 다음 "B"에 대해 동일한 시간을 기다립니다.

[다음으로, 나는 매 15 초마다 한 번의 "B"면을 가진 60면 주사위를 가지고 있다고 상상해보십시오 . 이제 0.9 초마다 굴리는 1000면 주사위를 가지고 있다고 상상해보십시오 (하나의 "B"면으로; 또는보다 사실적으로, 각각의 10면 주사위 3 개로 3 개 모두가 "10"이면 결과를 "B"라고 부릅니다. 같은 시간에) ... 등. 한계에서, 우리는 연속적인 포아송 프로세스를 얻습니다.]

그것을 보는 또 다른 방법은 이것입니다. 나는 올바른 방법으로 짧은 것보다 더 긴 간격 동안 내 '카운트 시작 롤'(즉, '승객이 버스 정류장에 도착합니다') 이벤트를 관찰 할 가능성이 더 큽니다. 평균 대기 시간은 버스 간 평균 시간과 동일합니다. (주로 긴 간격으로 대기하고 대부분 짧은 구간을 놓치게됩니다. 균일하게 분산 된 시간에 도착하기 때문에 길이 차이에 도달 할 가능성이 있습니다.

버스의 베테랑 포수로서, 실제로 현실은 '버스가 일정에 도착합니다'와 '버스가 임의에 도착합니다'사이 어딘가에있는 것처럼 보입니다. 때로는 (교통 체증이 심할 경우) 한 시간을 기다렸다가 3이 한 번에 도착합니다 (Zach는 그 이유를 아래 설명에 표시합니다).


6
버스는 특히 승객이 버스를 타면서 늦게 버스가 늦어지고 그 뒤에 빈 버스가 결국 잡히는 추가 프로세스가 있다고 생각합니다 (그러나 비어 있음). = D
Zach

4
@Zach는 실제로, 특히 교통량이 많은 경우 장기적으로 집중하는 경향이 있습니다. 버스가 너무 늦게 운행 할 때 다음 버스 시간이 다가 오면 버스를 따라가는 시간에 가까운 추가 버스를 삽입하는 경우가 있습니다. 일정은 종종 더 빠른 경로를 통해 거기에 도착) 그리고 지금 버스가 조금 늦은 승객을 태우기 시작합니다. 한편, 다른 버스가 도착한 곳에 도착 하면 가장 늦은 버스는 이제 스케줄 의 다음 버스가됩니다.
Glen_b

@Glen_b 정말 좋은 생각입니다.
Zach

유용한 안티-클 럼핑 전략입니다 (최소한 최악의 경우를 완화시킵니다). 더 정확한 버스 대기 시간 모델이 처리해야 할 수있는 의존성 문제와 관련이 있다는 점을 제외하고는 가져 오지 않았을 것입니다.
Glen_b

10

버스에 대한 자세한 내용 ... 토론에서 늦게 대화에 참여한 것은 유감이지만, 최근 포아송 프로세스를 살펴 보았습니다 .

λθ=1/λ=15 분이라고 가정합니다. 임의의 시간에 버스 정류장에서 실제로 버스를 픽업하고 있습니다. 따라서 임의의 시간에 버스 정류장에 나타날 경우, 한 달 동안 대기 시간에 대한 로그 북을 유지하면 실제로 버스 간의 평균 도착 시간이 표시됩니다. 그러나 이것은 당신이하고있는 것이 아닙니다.

우리가 파견 센터에 있었고 화면에서 모든 버스를 볼 수 있다면 무작위로 여러 버스를 픽업하고 뒤에서 버스까지의 거리를 평균하면 평균 도착 시간이 생성됩니다.

여기에 이미지 설명을 입력하십시오

그러나 대신 버스를 선택하는 대신 버스 정류장에 버스를 타는 것이 일반적인 아침에 버스 일정의 타임 라인을 따라 임의의 시간에 따라 진행됩니다. 우리가 버스 정류장에 표시하기로 결정한 시간은 "화살표"를 따라 균일하게 분포 될 수 있습니다. 그러나 버스 사이에 더 긴 시간 간격이 더 멀리 퍼져 있기 때문에 이러한 "트래 글러"를 오버 샘플링 할 가능성이 더 높습니다.

여기에 이미지 설명을 입력하십시오

... 따라서 대기 시간 일지에는 도착 시간이 반영되지 않습니다. 이것은 검사 역설입니다.

15'θ=15 분입니다. 이것은 Glen_b의 답변에있는 주사위 예제와 함께 이산 시간 (형상 분포)에서 가장 잘 나타납니다.

이자형[대기 시간 (미래) + 마지막 버스 출발 시간 (과거)]=30


여기에 이미지 설명을 입력하십시오


아직도 불분명합니까? - 레고 스와 함께 사용해보십시오 .


훌륭한 다이어그램.
Glen_b

2

주어진 평균 도착 시간 (이 경우 15 분)으로 포아송 프로세스 당 도착하는 버스의 예상 대기 시간을 계산하여 얻을 수있는 다른 응답을 해결하는 간단한 설명이 있습니다. .

방법 1 ) 포아송 프로세스 (지수)에 메모리가 없으므로 예상 대기 시간은 15 분입니다.

방법 2 ) 귀하는 도착한 도착 기간 동안 언제든지 도착할 가능성이 높습니다. 따라서 예상 대기 시간은이 도착 기간의 예상 길이의 1/2입니다. 이것은 정확하며 방법 (1)과 충돌하지 않습니다.

(1)과 (2)는 어떻게 정확할 수 있습니까? 정답은 도착한 시간 동안 도착 도착 시간이 15 분이 아니라는 것입니다. 실제로 30 분입니다. 30 분의 1/2은 15 분이므로 (1)과 (2)에 동의합니다.

도착한 시간 동안 도착 시간이 15 분이 아닌 이유는 무엇입니까? 도착 시간을 먼저 "고정"하면 도착 시간이 평균보다 긴 도착 시간보다 길기 때문입니다. 지수 도착 간 기간의 경우, 수학이 해결되므로, 도착한 시간을 포함하는 도착 구간은 포아송 프로세스에 대한 평균 도착 시간의 두 배인 지수입니다.

도착 시간을 포함하는 도착 시간에 대한 정확한 분포가 평균이 두 배가되는 지수 임은 분명하지 않지만 설명 후에 왜 증가했는지는 분명합니다. 이해하기 쉬운 예로, 도착 시간은 확률 1/2의 경우 10 분 또는 확률 1/2의 경우 20 분이라고 가정 해 봅시다. 이 경우 20 분 길이의 도착 간격은 10 분 길이의 도착 간격과 동일하게 발생하지만, 발생하면 두 배 더 오래 지속됩니다. 따라서 하루 중 시간대의 2/3는 도착 시간이 20 분인 시간입니다. 다른 방법으로, 만약 우리가 먼저 시간을 선택한 다음 그 시간을 포함하는 도착 시간이 무엇인지 알고 싶다면 ( "일"의 시작 부분에서 일시적인 영향을 무시 함) ) 해당 도착 시간의 예상 길이는 16 1/3입니다. 그러나 먼저 도착 시간을 선택하고 예상 길이가 무엇인지 알고 싶다면 15 분입니다.

갱신 패러독스, 길이 바이어스 샘플링 등의 다른 변형이 거의 동일합니다.

예 1) 수명이 일정하지만 평균 1000 시간 인 전구가 많이 있습니다. 전구가 고장 나면 즉시 다른 전구로 교체됩니다. 전구가있는 ​​방에 갈 시간을 선택하면 작동중인 전구의 평균 수명이 1000 시간보다 길어집니다.

예 2) 우리가 주어진 시간에 건설 현장에 가면 그 시간에 일하는 건설 노동자가 건물에서 떨어질 때까지의 평균 시간 (처음 작업을 시작한 시점부터)은 작업자까지의 평균 시간보다 큽니다. 일을 시작한 모든 근로자들 중에서 (처음 일을 시작했을 때부터) 떨어집니다. 왜, 떨어질 때까지 평균 시간이 짧은 근로자가 평균보다 떨어졌을 가능성이 높고 (일을 계속하지 않음), 일을하고있는 근로자가 떨어질 때까지 평균 시간보다 길기 때문입니다.

예 3) 도시에서 무작위로 소수의 사람들을 무작위로 골라 내고 그들이 메이저 리그 야구 팀의 홈 게임에 모두 참석 한 경우 (그들이 매진 한 것은 아님), 얼마나 많은 사람들이 게임에 참석했는지 확인하십시오. 그런 다음 (일부는 약간 이상적이지만 너무 불합리한 가정에서는) 해당 게임의 평균 출석률이 모든 팀의 홈 게임의 평균 출석률보다 높아집니다. 왜? 출석률이 낮은 게임보다 출석률이 높은 게임에 참여한 사람이 더 많으므로 출석률이 낮은 게임보다 출석률이 높은 게임을 선택한 사람을 선택할 가능성이 높습니다.


0

"... 버스는 15 분마다 버스 정류장에 도착하고 승객은 무작위로 도착합니다." 버스가 15 분마다 도착하면 무작위 가 아닙니다 . 15 분마다 도착하므로 정답은 7.5 분입니다. 출처가 잘못 인용되었거나 출처의 작성자가 조잡했습니다.

다른 한편으로, 방사선 검출기는 일부 분포, 아마도 평균 대기 시간을 갖는 포아송과 같은 분포에 따라 무작위로 도달하기 때문에 다른 문제처럼 들린다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.