포아송이 아닌 프로세스의 예?


15

학생들에게 Poisson 분포를 설명하는 데 도움이되는 Poisson 분포를 사용하여 모델링하기에 적합하지 않은 상황의 좋은 예를 찾고 있습니다.

일반적으로 Poisson 분포로 모델링 할 수있는 예로 간격으로 상점에 도착하는 고객 수를 사용합니다. 비슷한 맥락에서 반대의 예를 찾고 있습니다. 즉, Poisson이 아닌 연속 시간에 양수 계산 프로세스로 간주 될 수있는 상황입니다.

학생들이 이해하고 기억하기 쉽도록 상황은 가능한 한 간단하고 간단해야합니다.


5
이 질문은 매우 광범위합니다. 범위가 좁아지고 더 많은 컨텍스트가 추가되지 않으면 결국 닫힐 가능성이 큽니다. 불필요하게 거칠게 들린다는 의미는 없지만 "붉지 않은 꽃의 예는 무엇입니까?"와 유사합니다. (Cue Harry Chapin.)
추기경

1
요점을 알았어. 사과드립니다. 좀 더 구체적으로 말 했어야 했어요. 더 명확하게하기 위해 편집했습니다.
Nagel

1
질문과 의견에 (+1). 업데이트가 훨씬 좋습니다. :-)
추기경

2
나는 당신이 "사람들이 최소한 포아송을 순진하게 고려할 수있는 주어진 과정"을 의미한다고 가정하겠습니다 (예를 들어, 최소한의 과정). 일반적인 예는 일반적인 보험 (P & C 보험) 정책에 대한 클레임 수에서 발생합니다. 여러 가지 가능한 요인으로 인해 클레임 율이 이질성에 가장 많이 반영되어 있기 때문에 강도가 다른 포아송 프로세스의 중첩이 있습니다. 클레임 비율의 분포가 감마 분포에 의해 근사되는 경우, 클레임 수의 분포는 음의 이항에 의해 근사됩니다.
Glen_b-복지 주 모니카

답변:


5

일정 기간 동안 담배를 피우는 횟수 : 모든 담배를 피우는 것은 아니기 때문에 제로 팽창 된 과정 (예 : 제로 팽창 된 포아송 또는 제로 팽창 된 음의 이항)이 필요합니다.


감사! 여기에 많은 사람들이 제로 팽창 과정을 언급했지만 이것이 가장 간단하고 예시적인 예라고 생각합니다. 일정 기간 동안 무작위로 뽑힌 사람이 담배를 피우는 횟수.
Nagel

"모든 사람이 담배를 피우는 것은 아니다"라는 논란의 여지가 있지만,이 과정은 여전히 ​​포아송이라고 주장 할 수 있지만, 강도 매개 변수는 각 사람마다 다르고 알려지지 않은 것입니다 (흡연자가 아닌 사람은 매우 작습니다) 강도)-맞습니까? 그러나, 이러한 상황은 흡연 된 담배가 하루 동안 (일반 흡연자) 또는 클러스터 (사회 흡연자)에게 균등하게 퍼져서 분리 된 시간 간격이 독립적이지 않다는 점에서 포아송 가정을 위반한다고 주장 할 수 있습니다. 그래서 이것은 여전히 ​​좋은 예라고 생각합니다.
Nagel

1
일정 기간 동안 잡힌 물고기의 수는 ZIP 및 ZINB에 대한 더 정식적인 예라고 생각합니다. 비슷한 주장. 그럼에도 불구하고 물고기는 소비율에 중독성 영향을 줄 가능성이 없습니다. (나는 당신의 엄마의 물고기를 제외하고는 그들이 그렇게 좋기 때문에 알고 있습니다 .)
Alexis

8

양수 데이터를 의미합니까? 끝이 없습니까?

음 이항 법이 인기가 있습니다.

또 다른 좋은 모델은 0이 부풀린 포아송입니다.이 모델은 어떤 일이 일어나고 있거나 그렇지 않은 것으로 가정합니다. 만약 그렇다면, 그것은 포아송을 따릅니다. 최근에 예를 보았습니다. AIDS 환자를 치료 한 간호사는 AIDS 환자와의 관계로 다른 사람들의 낙인 행동을 얼마나 자주 경험했는지 물었습니다. 많은 사람들이 일하거나 살았던 곳 때문에 그런 경험을 한 적이 없었습니다. 그 중에서도 낙인 경험의 수는 다양했다. 포아송 (Poisson)에서 예상 한 것보다 더 많은 0이보고되었습니다. 기본적으로 연구 대상 그룹의 특정 비율이 그러한 행동에 노출 된 환경에 있지 않기 때문입니다.

푸 아송을 혼합하면 포인트 프로세스가 제공됩니다.


0으로 팽창 된 포아송 분포의 경우 (+1). 이 모델에 대한 토론은 여기서

1
초록 분포보다는 질문에 언급 된 상황 의 실제 예를 제공하는 +1 (및 기타 답변)에 +1합니다 . ZIP의이 예는 특히 명확합니다.
whuber

1
응답 한 사람들의 신용에 따르면, 나는 나의 질문이 처음에는 너무 조잡했고 상황을 전혀 언급하지 않았다는 것을 지적해야한다. 나는 0으로 부풀린 Poisson이 좋은 예라는 데 동의합니다. 그러나 학생들의 학점을 설명하기에는 너무 복잡하기 때문에 Poisson 분포로 모델링 할 수없는 간단한 상황의 예가 여전히 누락되었습니다.
Nagel

4

포아송이 아닌 프로세스를 계산합니까? 음, 이항 또는 이산 균일과 같은 유한 샘플 공간 프로세스. 기하 급수적으로 분배되는 독립적 인 도착 시간이있는 이벤트를 계산하여 포아송 계산 프로세스를 얻으므로 감마 또는 로그 정규 또는 Weibull 분산 도착 시간 또는 모든 종류의 추상 비모수 적 도착 시간을 갖는 것과 같은 전체 일반화가 실패합니다. 분포.


답장을 보내 주셔서 감사합니다. 처음에 제 질문이 불분명해서 죄송합니다. 나는 지금 그것을 명확히했다. 비지 수적 및 / 또는 종속적 인 도착 간 시간이있는 프로세스에 대해 말하는 것이 합리적이지만 이러한 속성을 갖는 상황의 예가 더 간단할수록 더 좋습니까?
Nagel

4
물론이지! 헤르페스 바이러스 발생 사이의 시간. 바이러스를 실제로 계약해야하기 때문에 초기 바이러스 발생에 훨씬 더 오랜 시간이 걸립니다. 그 이후의 발생 간 간격 시간은 서로 독립적이지만 인덱스 발생에 비해 훨씬 빠른 속도로 나타납니다. 비지 수적 도착 시간이 표준입니다. 생존 분석에서 일반적으로 사용되는 분석 방법은 도착 시간에 대한 모수 적 가정을 제거하는 Cox 비례 위험 모델입니다.
AdamO

좋은 예입니다! 나는 이것이 Placidia가 언급 한 0 팽창 부아 송의 또 다른 예라고 생각합니까?
Nagel

4

계산 프로세스를 원하는지 확실하지 않습니다.

'티칭'태그를 해석하여 포아송 프로세스를 가르치고 있음을 의미한다면, 일반적으로 프로세스에 대해 가르치기 위해 베르누이 프로세스 는 설명하고 시각화하기 쉬운 랜덤 프로세스이며 포아송 프로세스와 관련이 있습니다. Bernoulli 프로세스는 이산 아날로그이므로 유용한 동반자 개념이 될 수 있습니다. 연속 시간 대신에 불연속 시간 간격이 있다는 것입니다.

예를 들어, 문을 여는 판매원이 구매를하는 가정의 성공을 계산합니다.

  • 첫 n 개의 시도에서 성공한 횟수
    는 포아송 대신 이항 분포 B (n, p)를 갖습니다.
  • r 성공을 얻는 데 필요한 시행 횟수는 감마 분포 대신 음 이항 분포 NB (r, p)를 갖습니다.
  • 하나의 성공, 대기 시간을 얻는 데 필요한 시행 횟수는 기하 분포 NB (1, p)를 가지며, 이는 지수의 이산 유사체입니다.

이것이 Bertsekas와 Tsitsiklis가 사용하는 접근법입니다. 가 Poisson 프로세스 이전에 Bernoulli 프로세스를 소개하면서 Probability Introduction to Probability 입니다. 교과서에는 Poisson 프로세스에 적용 할 수있는 Bernoulli 프로세스에 대한 확장이 더 있습니다.

임의의 프로세스의 예를 찾고 있는데 이름을 버리고 싶다면 꽤 많은 것이 있습니다.

가우스 프로세스는 애플리케이션에서 중요한 프로세스입니다. 특히 가우시안 프로세스의 한 유형 인 와이너 프로세스는 표준 브라운 운동 (Brownian motion)이라고도하며 금융 및 물리학에 응용됩니다.


답장을 보내 주셔서 감사합니다. 제 질문이 처음에는 너무 커져서 명확하지 않은 것이 유감입니다. 나는 그것을 명확히하려고 노력했다. Bernoulli에서 Poisson으로의 연결은 흥미롭지 만, 내가 찾고있는 것은 Poisson 분포로 모델링하기에 적합하지 않은 연속적인 상황의 예입니다.
Nagel

3

재산 / 캐주얼 보험 계리사로서, 저는 항상 포아송이 아닌 개별 프로세스의 실제 사례를 다룹니다. 심각도가 높고 빈도가 낮은 비즈니스 라인의 경우, 포아송 분포는 분산 대 평균 비율이 1이기 때문에 적합하지 않습니다. 위에서 언급 한 음수 이항 분포가 훨씬 더 일반적으로 사용되고 델라 포르테 분포 표준 북아메리카 보험 계리 관행에서는 덜 사용되지만 일부 문헌에 사용됩니다.

이것이 더 깊은 질문 입니까? 음 이항은 평균 모수가 자체 감마 분포 인 포아송 과정을 나타 내기 때문에 훨씬 더 좋습니까? 또는 손실 발생이 독립성에 실패하기 때문입니다 (지진이 지구가 미끄러지기를 기다리는 시간이 길어질수록 압력 상승으로 인한 가능성이 더 높다는 현재 이론에 따라 지진이 발생하기 때문에) 불균일 한 포아송 (Poisson)을 사용할 수있는 고정 된 시퀀스로 나눌 수 없으며, 일부 비즈니스 라인은 동시 발생을 허용합니다 (예 : 정책이 적용되는 여러 의사의 의료 과실).


2

다른 사람들은 포아송이 아닌 포인트 프로세스의 몇 가지 예를 언급했습니다. Poisson이 지수가 아닌 도착 시간 분포를 선택하면 Poisson은 지수 도착 시간에 해당하므로 결과 점 프로세스는 Poisson이 아닙니다. AdamO는 Weibull을 지적했습니다. 가능한 선택으로 감마, 로그 정규 또는 베타를 사용할 수 있습니다.

푸 아송의 평균은 분산과 같습니다. 평균보다 큰 분산을 갖는 포인트 프로세스는 때때로과 분산 된 것으로 지칭되며 평균이 분산보다 큰 경우에는 과소 산포됩니다. 이 용어는 프로세스를 포아송과 관련시키는 데 사용됩니다. 음 이항은 매개 변수에 따라 과도하게 분산되거나 과소 산포 될 수 있기 때문에 종종 사용됩니다.

포아송은 일정한 분산을가집니다. 일정한 속도 매개 변수가없고 시간에 따라 변하는 평균 및 분산을 제외하고는 포아송 조건에 맞는 포인트 프로세스를 불균일 포아송이라고합니다.

도착 시간에 지수 시간이 걸리지 만 도착 시간에 여러 이벤트가있을 수있는 프로세스를 복합 포아송이라고합니다. 포아송 프로세스와 유사하고 그 안에 포아송이라는 이름을 가진 이름이 있지만, 불균일하고 복합적인 포아송 프로세스는 포아송 포인트 프로세스와 다릅니다.


답장을 보내 주셔서 감사합니다. 제 질문이 처음에는 너무 커져서 명확하지 않은 것이 유감입니다. 나는 그것을 명확히하려고 노력했다. 비지 수적 및 / 또는 종속적 인 도착 시간이있는 프로세스를 언급하고,과 분산 및 저 분산 분포에 대해 말하는 내용이 매우 흥미롭지 만 이러한 속성을 갖는 구체적인 상황에 대한 예가 있습니까? 더 간단할수록 좋습니다 :)
Nagel

1
내 자신의 대답을 시도하기보다는 계산 과정을 다루는 책에서 찾을 수있는 많은 예가 실제로 있다고 생각합니다. 음 이항 회귀 분석 에 관한 Joe Hilbe의 저서를보십시오 .
마이클 R. 체닉

2

비 포아송 카운팅 프로세스의 또 다른 흥미로운 예는 ZTPD (Zero-truncated Poisson Distribution)로 표시됩니다. ZTPD는 피험자가 생리 학적 조건에서 말할 수있는 언어의 수에 관한 데이터에 적합 할 수 있습니다. 이 경우, 포아송 분포는 잘못 작동합니다. 말하기 언어의 수는 정의에 따라> = 1이므로 0은 우선적으로 제외됩니다.


2

고객 도착 Poisson 프로세스를 수행하여 두 가지 방법으로 조정할 수 있다고 생각합니다. 1) 고객 도착은 하루 24 시간 측정되지만 매장은 실제로 하루 종일 열리지 않으며 2) 포아송은 고객 도착 시간을 처리하고 두 매장 도착 간의 차이를 확인합니다. (예 # 2는 Springer Handbook of Engineering Statistics, Part A Property 1.4에 대한 나의 이해에서 나온 것입니다.)


1

축구 예제를 ​​다시 고려할 수 있습니다. 경기가 진행됨에 따라 두 팀의 득점 률이 증가하고 팀이 현재 점수에 따라 공격 / 수비 우선 순위를 변경하면 변경됩니다.

또는 단순한 모델이 놀라 울 정도로 잘 수행되는 방법의 예로 사용하여 일부 현상의 통계적 조사에 대한 관심을 자극하고 불일치를 조사하고 정교화를 제안하기 위해 더 많은 데이터를 수집하는 향후 연구에 대한 벤치 마크를 제공하십시오.

Dixon & Robinson (1998), "협회 축구 경기의 출생 과정 모델", 통계 학자 , 47 , 3.


나는 축구 경기가 포아송이 아니었다는 직감을 가졌지 만 참고해 주셔서 감사합니다. :)
Nagel

1

질문은 Poisson 배포를보다 이해하기 쉽게 만드는 것과 관련이 있기 때문에 최근에 콜 센터 수신 통화 패턴 (시간이 지남에 따라 메모리가없는 지수 분포를 따르는)에 대해 다소 조사했기 때문에 한 번 살펴 보겠습니다.

Poisson에 대한 지식이 본질적으로 다소 혼란스럽지 않을 수 있다는 것을 깨닫기 위해 본질적으로 Poisson에 대한 지식이 필요한 다른 접선 모델을 탐구한다고 생각합니다.

Poisson을 이해하는 데 어려움이 있다고 생각합니다. 연속 시간 축입니다. 매 초마다 이벤트가 더 이상 발생하지 않을 것입니다. 그러나 앞으로 나아갈수록 더 확실합니다. 사고.

실제로 '시보'또는 '이벤트'에 대해 '시간'축을 교환하면 이해가 간단 해 진다고 생각합니다.

쉬운 설명이라고 생각할 때 누군가가베이스에서 벗어난 경우 나를 교정 할 수는 있지만 동전 던지기 또는 주사위 던지기를 '전화 통화가 도착할 때까지의 시간'으로 바꿀 수 있다고 생각합니다. 일반적으로 Erlang C / 콜센터 직원에 사용).

'전화가 도착할 때까지의 시간'대신 ---- '주사위가 6이 될 때까지 롤'로 바꿀 수 있습니다.

그것은 동일한 일반 논리를 따릅니다. (도박과 마찬가지로) 확률은 모든 롤 (또는 분)마다 완전히 독립적이며 메모리가 없습니다. 그러나 'No 6'의 가능성은 시험 횟수가 증가함에 따라 더 느리게 감소하지만 확실히 0쪽으로 감소합니다. 두 그래프를 모두 보면 (시간이 지남에 따라 호출 가능성, 롤이있는 6 개 가능성) 더 쉽습니다.

그게 말이되는지 모르겠습니다. --- 구체적인 용어로 정리하는 데 도움이되었습니다. 이제 포아송 분포는 '통화 사이의 시간'또는 '6을 굴릴 때까지의 시도'가 아닌 카운트이지만이 가능성에 의존합니다.


이것이 학생들에게 혼란 스러울 수 있다고 생각하는 방법을 알 수 있지만, 시간이 지나면 식당에 도착한 고객 수가 Poisson 인 이유를 쉽게 설명 할 수 있다는 생각이 들었습니다. -포아송이 아닌 연속 시간에 불연속 이벤트가있는 간단한 프로세스의 예.
Nagel

1
많은 옵션이 있다고 생각합니다. 명백한 패턴 중 하나는 자체 발생에 따라 확률이 증가 또는 감소하는 이벤트입니다. 몇 가지 예를 생각하기 어렵다. 아마도 당신의 부엌 / 소풍에 개미가 도착했을 것입니다. 첫 번째 개미가 도착하는 데 걸리는 시간은 아마도 두 번째 또는 세 번째보다 훨씬 길며, 물론 개미 도착이 많을수록 미래 개미 도착 가능성이 더 큽니다 (자신의 흔적 / 서로 통신 할 수 있음). 그것이 계산되는지 확실하지 않습니다.
존 밥슨

1

주어진 시간 간격 내에 개별 고객이 식료품 점을 방문한 횟수입니다.

식료품 점에 간 후에 계획 실수를하지 않으면 잠시 돌아올 것 같지 않습니다.

나는 부정적인 이항 분포가 여기에서 사용될 수 있다고 생각하지만, 방문은 계속되는 반면 불 연속적입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.