이전 이벤트 시간을 기준으로 다음 이벤트 발생시기를 예측하는 방법은 무엇입니까?


19

저는 고등학생이며 컴퓨터 프로그래밍 프로젝트를 진행하고 있지만 고등학교 통계 과정을 넘어서는 통계 및 모델링 데이터에 대한 경험이 많지 않아 혼란 스럽습니다.

기본적으로 누군가가 문서를 인쇄하기로 결정한 시간의 합리적으로 큰 목록 (통계 테스트 또는 측정에 대한 가정을 충족하기에 충분히 크다고 가정)을 가지고 있습니다. 이 목록을 바탕으로 이전 이벤트 시간을 모두 고려하여 다음 인쇄 작업에 가장 많은 시간을 예측하는 일종의 통계 모델을 구성하고 싶습니다.

나는 이미 이것을 읽었 지만 응답은 내 프로젝트에 대해 생각한 것을 정확하게 도와주지 않습니다. 추가 조사를 수행 한 후 숨겨진 Markov 모델 을 사용하면 정확하게 수행 할 수 있지만 시간 목록 만 사용하여 숨겨진 Markov 모델을 생성하는 방법에 대한 링크를 찾을 수 없습니다. 또한 목록에 Kalman 필터 를 사용하는 것이 유용 할 수는 있지만 기본적으로 실제로 사용하고 누군가가 시도하기 전에 제한 사항과 요구 사항을 알고있는 사람으로부터 더 많은 정보를 얻고 싶습니다.

무리 감사!


1
+1 이것은 잘 표현되고 잘 생각 된 질문 인 Ankush입니다. 좋은 답변을 받으시기 바랍니다. 우리 사이트에 오신 것을 환영합니다!
whuber

제목을 수정 해 주셔서 감사합니다. 단어를보다 일관성있게 만들기 위해 단어를 움직이고 있었기 때문에 전혀 이해가되지 않는 것 같습니다. 적절한 지식을 가진 사람이 도울 수 있기를 바랍니다.
ankushg

답변:


10

데이터가 관찰되지 않은 일부 Markov 모델에서 무작위로 배출 된 경우 숨겨진 Markov 모델이 적용됩니다. 나는 그것을 배제하지는 않지만 매우 자연스러운 모델은 아닙니다.

특정 데이터와 잘 일치하는 포인트 프로세스 에 대해 생각 합니다. 지진 (내가 그것에 대해 많이 알지는 않지만)과 심지어 범죄 를 예측하는 작업이 많이 있습니다.

인쇄하는 사람이 많고 시간을보고 있지만 개인 신원이 아닌 경우에는 포아송 프로세스가 제대로 작동 할 수 있지만 (여러 독립 포인트 프로세스의 중첩은 대략 포아송 임) 불균일해야하지만 ( 포인트의 가능성은 시간에 따라 다릅니다) : 사람들은 오후 3 시보 다 오전 3시에 인쇄 할 가능성이 적습니다.

를 들어 불 균질 포아송 프로세스 모델, 키는 특정 날짜에 특정 시간에 인쇄 작업의 기회의 좋은 평가를 받고있을 것이다.

그러나 이러한 인쇄 시간이 교실에있는 학생들을위한 것이면 독립적이지 않을 가능성이 높기 때문에 까다로울 수 있으므로 포아송 프로세스가 제대로 작동하지 않습니다.

다음 은 범죄 신청서에 관한 논문의 링크 입니다.


고마워 포인트 프로세스를위한 모델을 생성하는 방법을 알고 있습니까? 그것은 가장 관련성이있는 것 같지만 통계에 정통하지 않아서 Wikipedia를 읽을 때 혼란스러워 보입니다 (Poisson vs Determinantal vs Cox?) : :-\
ankushg

@ Unk-데이터의 플롯을 작성하여 시작합니다. 이 인쇄 시간 목록은 얼마나 걸립니까?
Karl

약 1 년 분량의 데이터입니다. 줄거리를 만들어서 어떻게 진행되는지 알려 드리겠습니다.
ankushg

1

MBSS (다변량 베이지안 스캔 통계)를 사용하여 예상 시간을 예측하면 도움이 될 수 있습니다. 이 MBSS는 이벤트 감지의 적시성과 정확성을 향상시키는 이점이 있습니다.


@Esan 사이트에 오신 것을 환영합니다. MBSS, 작동 방식 및 도움이되는 방법에 대해 더 자세히 말씀해 주시겠습니까?
gung-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.