내가 얻은이 이산 분포 (재귀 차이 방정식)의 이름은 무엇입니까?


11

나는 컴퓨터 게임에서이 배포판을보고 그 동작에 대해 더 배우고 싶었다. 주어진 수의 플레이어 동작 후에 특정 이벤트가 발생해야하는지에 대한 결정에서 비롯됩니다. 이 이상의 세부 사항은 관련이 없습니다. 다른 상황에도 적용되는 것 같고 계산하기 쉽고 긴 꼬리를 만들기 때문에 흥미로 웠습니다.

모든 단계 에서, 게임은 균일 한 난수 합니다. 경우 , 이벤트가 트리거된다. 이벤트가 한 번 발생한 후 게임은 재설정 하고 시퀀스를 다시 실행합니다. 게임이 사용하는 배포판을 나타 내기 때문에이 문제에 대해 한 번만 발생하는 이벤트에 관심이 있습니다. (여러 발생에 대한 모든 질문은 단일 발생 모델로 답변 할 수 있습니다.)0 X < 1 X < p ( n ) n = 0n0X<1X<p(n)n=0

여기서 "비정상"은이 분포의 확률 매개 변수가 시간이 지남에 따라 증가하거나 다른 방식으로 임계 값이 시간이 지남에 따라 증가한다는 것입니다. 이 예에서는 선형으로 변경되지만 다른 규칙이 적용될 수 있다고 가정합니다. 단계 또는 사용자의 조치 후n

p(n)=kn

어떤 정수에 대하여, . 특정 시점에서 이면 p (n _ {\ max}) \ geq 1이 됩니다. 해당 단계에서 이벤트가 발생하도록 보장됩니다.0<k<1nmaxp(nmax)1

나는 그것을 결정할 수 있었다

f(n)=p(n)[1F(n1)]
F(n)=p(n)+F(n1)[1p(n)]
PMF f(n) 및 CDF F(n) . 간단히 말해서, n 번째 단계 에서 이벤트가 발생할 확률은 p (n) 확률과 같으며 p(n), 이전 단계에서 이미 발생한 확률이 적습니다.

다음은 친구 인 Monte Carlo의 k \ approx 0.003 과의 플롯입니다 k0.003. 중앙값은 21, 평균은 22입니다. 여기에 이미지 설명을 입력하십시오

이것은 내 배경 인 디지털 신호 처리의 1 차 차이 방정식과 대체로 동일하므로 매우 참신합니다. 또한 p(n) 이 임의의 공식에 따라 달라질 수 있다는 개념에 흥미 가 있습니다.

내 질문 :

  1. 이 배포판의 이름은 무엇입니까?
  2. 발현 유도하는 어떤 방법이 참조하지 않고 ?F ( n )f(n)F(n)
  3. 이와 같은 불연속 재귀 분포의 다른 예가 있습니까?

난수 생성에 대한 명확한 프로세스를 편집합니다 .


1
() 대신 대괄호를 선택한 이유가 있습니까?
Cam.Davidson.Pilon

1
@ Cam.Davidson.Pilon : DSP 배경이 제대로 작동하지 않습니다. 개별 시간 함수에는 대괄호를 사용하는 경향이 있습니다. 나는 이것이 엉망이 될 것 같아서 바꿀 것입니다.
jbarlow 2016

1
가정하는 프로세스가 여기에 명확하게 정의되어 있지 않습니다. " 단계마다 게임이 난수 굴립니다 . 이면 이벤트가 트리거됩니다." 그러나 를 그리는 방법에 대한 사양은 제공하지 않습니다 . 프로세스를 좀 더 정확하게 설명 할 수 있다면 도움이 될 것입니다. X X < p ( n ) XnXX<p(n)X
추기경

2
@jbarlow : 이전 의견이 명확하지 않은 경우 죄송합니다. 만약 일부 , 다음 프로세스가 이상 할 수있는 방법이 없다 제로 사이의 균일 한 난수 이후 단계는 하나는 확실히 작은 것 대해 보다 큽니다 . 수량 의 함수로서 매우 밀접 소위 관련된 위험 함수 라고도 통계의 서브 필드에서 생존 분석 . 0 < k < 1 k 1p ( n ) n > 1 / k p ( n ) np(n)=kn0<k<1k1p(n)n>1/kp(n)n
추기경

1
작은 들어 있음이 차분 방정식 쇼 차동 아날로그하여 ( 되지 !)에 근접 가우스이다. (이로부터 우리는 즉시 추론 예를 들어, 그 평균이 근처에 있어야합니다 .) 제발 참고도에 일부 (강한) 제한이 있음을 , 그렇지 않으면 이 초과하면 (결국 그렇게 함) 가 보다 작거나 같다는 보장은 없습니다 . F f kF fkp(n)1 개F11/k=33318kp(n)1F1
whuber

답변:


9

어떤 의미에서, 당신이 한 일은 음이 아닌 정수 값 분포를 모두 특성화 하는 것입니다 .

랜덤 프로세스에 대한 설명을 잠시 남겨두고 문제의 재귀에 초점을 맞추겠습니다.

만약 다음 확실히 . 생존 함수 ( 는 분포 )의 관점 에서이 두 번째 재귀를 다시 매우 암시적이고 다루기 쉬운 것을 얻습니다. 분명히 등 따라서 시퀀스 이 값을 취하고 너무 빠르게 0으로 수렴하지 않는 한 유효한 생존 함수를 얻습니다 (즉, 로 단조롭게 0으로 감소 ).F n = p n + ( 1 p n ) F n 1 S n = 1 F n = P ( T > n ) T F S n = 1 F n = ( 1 p n ) S nfn=pn(1Fn1)Fn=pn+(1pn)Fn1 Sn=1Fn=P(T>n)TFS n = n k = 0 ( 1 - p k )

Sn=1Fn=(1pn)Sn1,
( p n ) [ 0 , 1 ] n
Sn=k=0n(1pk).
(pn)[0,1]n

더 구체적으로,

제안 : 값을 취하는 시퀀스 는 경우에만 음수가 아닌 정수에 대한 분포를 결정합니다 그러한 모든 분포는 대응하는 순서를 갖습니다 (고유하지는 않더라도).[ 0 , 1 ] n = 0 로그 ( 1 p n ) = (pn)[0,1]

n=0log(1pn)=,

따라서 문제에 기록 된 재귀는 완전히 일반적입니다 . 음이 아닌 정수 값 분포는 값을 갖는 해당 시퀀스 를 가지며 입니다.[ 0 , 1 ](pn)[0,1]

그러나 그 반대는 사실이 아닙니다. 즉, 유효한 분포에 해당하지 않는 값을 갖는 시퀀스 가 있습니다 . (특히, 고려 모든 및 에 대한 ).(pn)[0,1]0<pn<1nNpn=0n>N

그러나 더 많은 것이 있습니다!

우리는 생존 분석과 관련이 있다는 것을 암시했고 이것을 조금 더 깊이 살펴볼 가치가 있습니다. 절대적으로 연속적인 분포 와 해당 밀도 를 갖는 고전적인 생존 분석 에서 위험 함수Ff

h(t)=f(t)S(t).

누적 위험은 다음이다 및 유도체 프로그램의 간단한 분석이 이것으로부터 우리는 즉시 허용 가능한 위험 함수의 특성을 부여 할 수 있습니다. 그것은 모든 대해 및 와 같이 측정 가능한 함수 입니다. 같은 .Λ(t)=0th(s)ds

S(t)=exp(Λ(t))=exp(0th(s)ds).
hh(t)0t0th(s)dst

대해 위의 생존 함수와 유사한 재귀를 얻습니다.t>t0

S(t)=et0th(s)dsS(t0).

특히 우리가 를 각 조각이 너비 1 인 부분적으로 일정하고 정수가 무한대로 수렴되도록 선택할 수 있음을 관찰하십시오 . 이것은 각각의 양의 정수에서 하나의 값을 갖는 원하는 임의의 음이 아닌 정수와 일치 하는 생존 함수 를 산출 할 것이다 .h(t)S(t)

개별 케이스에 다시 연결

바람직한 이산 일치 각각 정수로를, 우리는 그 조각 별 일정 위험 함수 선택해야 에 .이 제 시퀀스에 필요한 조건을 제공 증명 유효한 분포를 정의한다.S(n)

h(t)=hn=log(1pn),
(n1,n](pn)

작은 경우 은 연속 분포의 위험 함수와이 분포에 일치하는 생존 함수를 갖는 이산 분포 간의 휴리스틱 연결을 제공합니다. 정수.pnlog(1pn)pn=fn/Sn1

Postscript : 마지막으로, 문제의 예제 은 에서 을 적절하게 수정하지 않고 모든 대해 을 설정 하지 않으면 필요한 조건을 충족 하지 않습니다. .pn=knfnn=k1fn=0n>k1


1
+1 매우 밝습니다. 그러나 포스트 스크립트와 관련하여, "적절한 잘림"은 특별한 값에 대한 당연히 발생하는 것으로 보입니다 . 예를 들어,로 우리가 구 ,보다 일반적으로 우리 얻을 입니다. kk=1/2f=(0,1/2,1/2,0,)k=1/mf(m+1)=f(m+2)==0
whuber

2
@ whuber : "적절한 잘림"의 의미를 더 명확하게 지정해야합니다. 지정된 지점에서 값 을 (축소) 생각 했습니다 ( 이 되도록 ). 나는 당신이 언급 한 경우에 개념이 여전히 유효하다고 생각합니다. 절단으로 인해 값이 변경되지 않을 것 입니다. 나는 이것을 곧 편집에서 명확히하려고 노력할 것이다. 감사합니다! fnFnfn
추기경

2
좋은 대답입니다. 이것은 매우 통찰력이 있습니다. 나는이 문제가 다른 영역과 개념과 관련이있는 것을보고 정말로 관심이 있었다.
jbarlow

1
@jbarlow : 감사합니다. 도움이 되셨 다니 다행입니다. 나는 좋은 질문이기 때문에 그것에 대해 조금 생각하는 것을 즐겼습니다.
추기경

9

케이스에 , 우리는 어떤 공지 된 특성을 갖는다. 우리는 재발 관계를 해결할 수 있습니다p(n)=p<1

F(n)=p+F(n1)(1p);F(0)=p

해결책이있다

F(n)=P(Nn)=1(1p)n+1
이것은 기하 분포 입니다. 잘 연구되었습니다.

의 더 일반적인 경우 는 아마도 닫힌 형태로 계산 될 수 없으므로 알려진 분포가 없을 것입니다.p(n)

다른 경우 :

  1. p(n)=pn;p<1;F(0)=p 는 해를 일반적으로 알려진 배포판이 아닙니다.
    F(n)=1(1p)Γ(n+1p)Γ(1p)Γ(n+1)
  2. 정의 (통계의 생존 기능이라고 함), 위의 간단한 형태로 감소 점화식 S(n)=1F(n)
    S(n)=(1p(n))S(n1)
  3. 귀하의 예제에서, 당신이 함수 원하는 표시 증가가 . 당신의 선택 은 의 중단으로 인해 분석적으로 좋지 않습니다 . 수학자와 통계학자는 부드러운 것을 선호합니다 . 그래서 나는 이 함께 점화식 해결 1. 수렴 , 좋은 분석 형태 갖는다 : 고려 . 알려진 통계 사실은 p(n)np(n)=knp>1
    p(n)=1(1p)n+1p<1
    p(0)=pp(n)S(n)=1F(n)=(1p) n + 1
    F(n)=1(1p)n+1n!
    i=0S(i)=E[N]E[N]=(1-p)e(1-p)S(n)=1F(n)=(1p)n+1n!
    i=0S(i)=E[N]
    미적분학을 기억하면 지수의 Taylor 시리즈와 매우 비슷해 보이므로
    E[N]=(1p)e(1p)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.