베이지안 온라인 변경점 탐지 (마진 예측 분포)


9

Adams와 MacKay 의 Bayesian 온라인 변경점 감지 논문을 읽고 있습니다 ( 링크 ).

저자는 한계 예측 분포를 작성하여 시작합니다.

P(xt+1|x1:t)=rtP(xt+1|rt,xt(r))P(rt|x1:t)(1)
어디
  • xt 시간의 관찰이다 t;
  • x1:t 시간까지의 관측 세트를 나타냅니다 t;
  • rtN현재 실행 길이 (마지막 변경점 이후 시간, 0 일 수 있음)입니다. 과
  • xt(r) 실행과 관련된 관측 값 세트입니다. rt.

등식 1은 공식적으로 정확하지만 (@JuhoKokkala의 아래 답변 참조) 내 이해는 실제로 예측하려는 경우xt+1 다음과 같이 확장해야합니다.

P(xt+1|x1:t)=rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b)

내 추론은 (미래) 시간에 변화 점이있을 수 있다는 것입니다. t+1, 그러나 후부 P(rt|x1:t) 까지만 커버 t.

요점은 논문의 저자들이 우리를 Eq. 1 은 그대로 (용지의 식 3과 11 참조) 1b가 아닙니다 . 그래서 그들은 시점에서 변화 지점의 가능성을 무시하는 것처럼 보입니다.t+1 예측할 때 xt+1 시간에 사용 가능한 데이터에서 t. 섹션 2의 시작 부분에서 그들은 enpassant 라고 말합니다

예측 분포를 계산할 수 있다고 가정합니다. xt+1] 주어진 실행 길이에 조건부 rt.

아마도 트릭이있는 곳일 것입니다. 그러나 일반적으로이 예측 분포는 Eq. 1b; 그것은 그들이하는 일이 아닙니다 (식 11).

그래서, 나는 무슨 일이 일어나고 있는지 잘 모르겠습니다. 아마도이 표기법에는 재미있는 것이있을 것입니다.


참고

  • Adams, RP, MacKay, DJ (2007). 베이지안 온라인 변경점 감지. arXiv 프리 프린트 arXiv : 0710.3742.

잠재적 인 설명은 rt시간 단계 종료시 실행 길이를 나타냅니다.t, 시간 변경 시점 이후t. 이것으로 Eq. 1 의미가 있습니다. 실제로 알고리즘의 한 가지 초기화는P(r0=0)=1 시작하기 직전에 변경점이 있다고 가정합니다. t=1. 그러나 그림 1 사이에 변경점이 있으면 그림 1은 잘못되었습니다 (또는 적어도 오도합니다)t=4t=5사이에 t=10t=11 도 1a에 도시 된 바와 같이, r4r10 이 표기법에 따라 0이어야합니다. r5r11그림 1b에 따라.
lacerbi

1
Eq.에 이상한 일이 있습니다. 마지막 줄에서 소환의 중간 요소는 3입니다. P(xtrt1,xt(r)) 내가 생각하는 동안 xt(r) 포함 xt. 나는 의심tt1 장소를 전환했다 P(xtrt,xt1(r))말이 될 것입니다. 식에서 11, 오른쪽에 의존하는 것 같습니다xt(r)왼쪽에 전혀 나타나지 않으므로 잘못된 것이 있거나 표기법을 전혀 이해하지 못합니다.
Juho Kokkala

@JuhoKokkala : 나는 그 느낌을 가진 유일한 사람이
아니라서 기쁘다

1
@lacerbi, 나는이 논문에 대한 또 다른 질문이 있으며, stats.stackexchange.com/questions/419988 과 같이 작업에 익숙해 보이므로 대답 할 수 있다고 생각합니다 .
gwg

답변:


5

(1)과 (1b)는 모두 정확합니다. OP는 (이 모델에서)t+1, xt+1변경점이 있는지 여부에 따라 다릅니다. 이것은 가능한 값으로 (1)과 관련된 문제를 의미하지 않습니다.rt+1 에 의해 완전히 "덮여있다" P(xt+1rt,x1:t). P(xt+1|rt,x1:t) 조건부 분포를 의미합니다. xt+1 조건부 (rt,x1:t). 이 조건부 분포는 다음을 포함하여 "다른 모든 것"보다 평균입니다.rt+1조건부 (rt,x1:t). 사람이 쓸 수있는 것처럼P(xt+1000|xt)변경점의 모든 가능한 구성과 값을 고려합니다. xi사이에 발생 tt+1000.

나머지 부분에서는 먼저 (1)을 기반으로 (1)과 (1b)를 도출합니다.

(1)의 유도

임의의 변수 A,B,C우리는

P(AB)=cP(AB,C=c)P(C=cB),
하는 한 C불 연속적입니다 (그렇지 않으면 합계를 정수로 대체해야 함). 이것을 적용xt+1,x1:t,rt:

P(xt+1x1:t)=rtP(xt+1rt,x1:t)P(rtx1:t),
어떤 의존성에 관계없이 rt, x1:t, xt+1즉, 모델 가정이 아직 사용되지 않은 것입니다. 현재 모델에서xt+1 주어진 rt,xt(r) 조건부 값에 독립적 인 것으로 가정 * x 전에 실행에서 xt(r). 이것은 암시P(xt+1rt,x1:t)=P(xt+1rt,xt(r)). 이것을 이전 방정식으로 대체하면

P(xt+1x1:t)=rtP(xt+1rt,xt(r))P(rtx1:t),(1)
OP에서 (1)입니다.

(1b)의 유도

우리의 분해를 고려하자 P(xt+1rt,xt(r)) 가능한 값보다 rt+1:

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,rt,xt(r))P(rt+1rt,xt(r)).

변경점이 발생하는지 여부가 가정되기 때문에 * t+1 (중에서 xtxt+1)의 역사에 의존하지 않습니다 x우리는 P(rt+1rt,xt(r))=P(rt+1rt). 또한, 이후rt+1 여부를 결정 xt+1 같은 실행에 속한다 xt우리는 P(xt+1rt+1,rt,xt(r))=P(xt+1rt+1,xt(r)). 이 두 가지 단순화를 위의 인수 분해로 대체하면

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,xt(r))P(rt+1rt).
이것을 (1)로 대체하면
P(xt+1x1:t)=rt(rt+1P(xt+1rt+1,xt(r))P(rt+1rt))P(rtx1:t),(1b)
이것은 OP (1b)입니다.

* 모델의 조건부 독립성 가정에 대한 언급

논문을 신속하게 찾아 보면 조건부 독립 속성이 개인적으로 어딘가에 더 명확하게 언급되기를 원하지만 그 의도는 다음과 같습니다. r Markovian이고 x다른 실행과 관련된 : s는 독립적입니다 (실행이 주어짐).


1
(+1) 감사합니다. 물론, 나는 그 식을 이해합니다. 1이 암시 적 소외를 가정하는 경우 공식적으로 정확함rt+1. 문제는 나중에 저자들이 예측을하고 (논문에서 식 11과 암시 적으로 식 3에서), 그것들이 과장되지 않았다는 것입니다.rt+1그들이 그들을 취할 때.
lacerbi

1
오. 그렇다면 질문을 오해 한 것 같습니다. 이것을 삭제해야합니까? 당신은 질문을 명확하게하고 싶을 수도 있습니다. 현재 그것은 (1) 어떤 식 으로든 (아마 유용하지 않은) 부정확 한 것 같습니다
Juho Kokkala

이 답변을 유지하십시오. 원래 게시물에서 명확하지 않은 실수. 귀하의 의견에 감사드립니다.
lacerbi
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.