포아송과 지수 분포의 관계

72

포아송 분포의 대기 시간은 매개 변수 람다를 사용한 지수 분포입니다. 그러나 나는 그것을 이해하지 못한다. 포아송은 예를 들어 단위 시간당 도착 수를 모델링합니다. 이것은 지수 분포와 어떤 관련이 있습니까? 시간 단위로 k 도착 확률이 P (k) (poisson으로 모델링 됨)이고 k + 1 확률이 P (k + 1)라고 가정하면 지수 분포는 어떻게 그들 사이의 대기 시간을 모델링합니까?

distributions poisson-distribution exponential

— 사용자
소스

3

푸 아송 분포 에는 대기 시간이 없습니다. 그것들은 포아송 프로세스의 속성입니다.

— Glen_b

이 두 분포의 차이점에 대한 자세한 설명 은 여기를 참조 하십시오 .

— Belter

73

나는 (당신이 앞뒤로 내 대답과의 위키 정의 사이에 가고 싶은 경우에 위키와 최대한 일치하도록 다음과 같은 표기법을 사용합니다 포아송 및 지수 .)

$N_t$ : 기간 동안의 도착 수 $t$

$X_t$ : 누군가가 시간 에 도착했다고 가정하고 한 번의 추가 도착에 도착하는 데 걸리는 시간 $t$

정의에 따라 다음 조건은 동일합니다.

$(X_t > x) \equiv (N_t = N_{t+x})$

왼쪽의 이벤트는 시간 간격 아무도 도착하지 않은 이벤트를 캡처합니다 이는 시간 에서의 도착 횟수가 시간 에서의 카운트와 일치 함을 의미합니다 . 오른쪽에 이벤트. $[t,t+x]$ $t+x$ $t$

보완 규칙에 따라 다음과 같은 사항도 있습니다.

$P(X_t \le x) = 1 - P(X_t > x)$

위에서 설명한 두 이벤트의 동등성을 사용하여 위의 내용을 다음과 같이 다시 작성할 수 있습니다.

$P(X_t \le x) = 1 - P(N_{t+x} - N_t = 0)$

그러나,

$P(N_{t+x} - N_t = 0) = P(N_x = 0)$

위의 포아송 pmf를 사용하면, 여기서 는 시간 단위당 평균 도착 수이고 시간 단위의 수량은 다음과 같이 단순화됩니다. $\lambda$ $x$

$P(N_{t+x} - N_t = 0) = \frac{(\lambda x)^0}{0!}e^{-\lambda x}$

즉

$P(N_{t+x} - N_t = 0) = e^{-\lambda x}$

원래의 eqn으로 대체하면 다음과 같은 이점이 있습니다.

$P(X_t \le x) = 1 - e^{-\lambda x}$

위는 지수 pdf의 cdf입니다.

— 나방
소스

7

좋아, 분명해. 지수 pdf는 두 개의 연속 포아송 히트 사이의 대기 시간을 모델링하는 데 사용될 수 있으며 포아송은 히트 수의 확률을 모델링합니다. 포아송은 이산적이고 지수는 연속 분포입니다. 두 사람이 동시에 활동하는 실제 사례를 보는 것이 흥미로울 것입니다.

— user862

1

응? 이다 순간 시간 또는 기간 시간?

t

$t$

— CodyBugstein

2

포아송 분포는 이벤트 사이의 대기 시간에 대한 지수 pdf를 자동으로 암시하지 않습니다. 이것은 포아송 프로세스가 작동 중임을 알고있는 상황만을 설명합니다. 그러나 포아송 분포가 존재한다는 것을 보여 주려면 포아송 분포의 존재와 지수 pdf가 존재 함을 증명해야합니다!

— Jan Rothkegel

@CodyBugstein 둘 다 :이 문맥에서 상호 교환 가능합니다. 도착은 서로 독립적이므로 시간 오프셋이 중요하지 않습니다. 시간의 기간 0시간까지이 t길이의 기간에 해당합니다 t.

— Chiel ten Brinke

@ user862 : 주파수와 파장의 관계와 정확히 유사합니다. 더 긴 파장; 더 낮은 주파수와 유사한 것 : 더 긴 대기 시간; 더 낮은 예상 도착.

— DWin

38

포아송 과정의 경우, 안타는 과거의 임의 독립적으로 발생하지만 알려진 장기 평균 속도와 시간 단위 당 히트. 포아송 분포를 통해 특정 개수의 적중을 얻을 확률을 찾을 수 있습니다. $\lambda$

이제, 적중 수를 보는 대신 , 첫 번째 적중을 기다려야 하는 무작위 변수 (일생 동안)을 봅니다. $L$

대기 시간이 주어진 시간 값보다 클 확률은 (Poisson 분포에서, 여기서 ). $P(L \gt t) = P(\text{no hits in time t})=\frac{\Lambda^0e^{-\Lambda}}{0!}=e^{-\lambda t}$ $\Lambda = \lambda t$

$P(L \le t) = 1 - e^{-\lambda t}$ (누적 분포 함수). 우리는 이것의 미분을 취함으로써 밀도 함수를 얻을 수 있습니다 :

f (t) = {\begin{cases} λ e^{- λ t} & for t \geq 0 \\ 0 & for t < 0 \end{cases}

$f(t) = \begin{cases} \lambda e^{-\lambda t} & \mbox{for } t \ge 0 \\ 0 & \mbox{for } t \lt 0 \end{cases}$

이와 같은 밀도 함수를 갖는 임의의 변수는 기하 급수적으로 분포한다고합니다.

— 조지 돈 타스
소스

2

나는 (시간 t에 적중 없음) 설명을 즐겼습니다 . 이것은 나에게 의미가 있었다.

P (L > t) = P

$P(L>t)=P$

— user1603548

1

또 다른 요점은 1 단위 시간에 적중이 있으므로, 단위 시간에 적중이 있습니다.

λ

$\lambda$

t

$t$

λ t

$\lambda t$

— Belter

5

다른 답변은 수학을 잘 설명해줍니다. 실제 사례를 고려하면 도움이된다고 생각합니다. 포아송 프로세스에 대해 생각할 때, 나는 항상 길을 지나가는 자동차의 아이디어로 돌아옵니다. 람다는 시간당 60 대 (람다 = 60)라고하는 평균 차량 수입니다. 그러나 우리는 실제 숫자가 다양 할 것임을 알고 있습니다. 포아송 분포를 통해이 변동성을 모델링 할 수 있습니다.

이제 시간당 평균 60 대의 자동차는 1 분당 평균 1 대의 자동차에 해당합니다. 다시, 우리는 도착 사이의 시간의 양에 변동이있을 것이라는 것을 알고 있습니다 : 때때로 1 분 이상; 다른 시간 적은. 지수 분포를 통해이 변동성을 모델링 할 수 있습니다.

그러나 도로를 지나가는 자동차가 항상 포아송 프로세스를 따르는 것은 아닙니다. 예를 들어, 모퉁이 근처에 교통 신호가있는 경우 도착이 꾸준하지 않고 뭉쳐집니다. 열린 고속도로에서 느린 트랙터-트레일러는 긴 줄의 차량을 움켜 쥐고 다시 뭉칠 수 있습니다. 이 경우, 포아송 분포는 더 오랜 시간 동안 계속 작동 할 수 있지만, 도착 시간을 모델링 할 때 지수가 나빠질 수 있습니다.

또한 하루 중 시간에 따라 큰 변동성이 있습니다. 오전 3시에 훨씬 느립니다. 람다는 고려중인 특정 기간을 반영해야합니다.

— 사용자 2024015
소스

4

포아송 분포는 일반적으로 이항 분포 (이산 분포)에서 파생됩니다. 이것은 Wiki에서 찾을 수 있습니다.

그러나 포아송 분포 (이산)는 지수 분포 (연속)에서 파생 될 수도 있습니다.

Wiki에 증거를 추가했습니다 (아래 링크).

https://ko.wikipedia.org/wiki/Talk:Poisson_distribution/Archive_1#Derivation_of_the_Poisson_Distribution_from_the_Exponential_Distribution

— 스튜어트 윈터
소스

이산과 연속 사이의 연결은 분명하지 않았습니다. 이것 덕분에!

— jspacek