기차가 오기 전에 시간을 모델링하는 데 사용할 분포는 무엇입니까?


15

기차 도착 시간에 대한 일부 데이터를 모델링하려고합니다. "기다리는 시간이 길수록 열차가 나타날 가능성이 높다"는 내용 의 배포판을 사용하고 싶습니다 . P (train show up | 60 분 기다림)가 1에 가까워 지도록 그러한 분포가 CDF처럼 보일 것 같습니다. 여기서 사용하기에 적합한 분포는 무엇입니까?


10
25 시간 동안 기다렸다가 기차가없는 경우 다음 순간에 기차 가 뜰 가능성은 가까울 것 입니다. 노선이 일시적으로 또는 영구적으로 폐쇄되었을 가능성이 있습니다0
Henry

@Henry, 이것은 이전 확률에 대한 당신의 생각에 전적으로 달려 있습니다. 예를 들어, 영국에서 가장 적게 사용 된 기차역 인 theguardian.com/uk-news/2016/dec/09/… 은 하루 이상 (일요일에는 서비스가 없음) 도착 간격이 없습니다.
Sextus Empiricus

@MartijnWeterings-아마도 언론인 덕분에 Shippea Hill은 사용량이 1200 % 증가했으며 다음 해에는 사용량이 가장 낮지 않았으며 , Teesside Airport와 같은 일부 열차는 일주일에 한 방향으로 기차를 운행합니다
Henry

답변:


17

두 확률의 곱셈

tt + d t (대기 시간) 사이의 시간에 처음 도착할 확률 은tt+dt

  • tt+dt 사이에 도달 할 확률 ( 시간 t에 도착률 s(t) 과 관련 될 수 있음 )t
  • 시간 t 전에 도착하지 않을 확률 (또는 그렇지 않으면 첫 번째가 아닐 것).

후자의 용어는 다음과 관련이 있습니다.

P(n=0,t+dt)=(1s(t)dt)P(n=0,t)

또는

P(n=0,t)t=s(t)P(n=0,t)

기부:

P(n=0,t)=e0ts(t)d

대기 시간에 대한 확률 분포는 다음과 같습니다.

f(t)=s(t)e0ts(t)dt

누적 분포의 유도.

또는 시간이 t 인 조건부 에서 하나 미만의 도착 확률에 대한 표현식을 사용할 수 있습니다.t

P(n<1|t)=F(n=0;t)

시간 tt+dt 사이에 도달 할 확률 은 도함수와 같습니다.

farrival time(t)=ddtF(n=0|t)

이러한 접근법 / 방법은 예를 들어 포아송 프로세스에서 n 번째 도착을위한 대기 시간으로서 감마 분포를 도출하는데 유용하다. ( 포아송 프로세스 시간-감마-분포 대기 시간 )


두 가지 예

이것을 대기 역설과 관련시킬 수 있습니다 (대기 역설을 설명하십시오 ).

  • 지수 분포 : 도착이 포아송 프로세스와 같이 임의 인 경우 s(t)=λ 는 일정합니다. 다음 도착 확률은 도착하지 않은 이전 대기 시간과 무관합니다 (예를 들어 6없이 공정한 주사위를 여러 번 굴리면 다음 롤의 경우 갑자기 6에 대한 확률이 더 높지 않습니다. 도박꾼의 오류를 참조하십시오 ) . 지수 분포를 얻게되고 대기 시간에 대한 pdf는 다음과 같습니다.

    f(t)=λeλt

  • Tts(t)=1/(Tt)

    f(t)=e0t1TtdtTt=1T
    0T사이의 모든 시간이 첫 번째 도착과 동일한 확률을 가져야하기때문에 의미가 있습니다.


따라서 두 번째 경우입니다. "그러면 누군가가 이미 일정 시간 동안 기다렸을 때 도착 확률이 높아지고 있습니다"는 귀하의 질문과 관련이 있습니다.

상황에 따라 약간의 조정이 필요할 수 있습니다. 더 많은 정보 를 가지고 기차가 특정 순간에 도착할 확률 s(t)dt 는 더 복잡한 기능 일 수 있습니다.


StackExchangeStrike에 의해 작성


7

대기 시간을 모델링하기위한 고전적인 분포는 지수 분포 입니다.

지수 분포는 균일 한 포아송 프로세스에서 도착 간 시간의 길이를 설명 할 때 자연스럽게 발생합니다.


2
네,하지만 포아송 프로세스는 열차 네트워크에 적합한 모델이 아닙니다.
leftaroundabout
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.