"정책"변경으로 인한 시계열 데이터의 중대한 변화를 감지하는 방법은 무엇입니까?


15

나는 이것이이 글을 올릴 수있는 장소가 되었으면 좋겠다. 회의론자들에게 게시하는 것을 고려했지만, 그들이 연구가 통계적으로 잘못되었다고 생각했을 뿐이다. 나는 그것을 올바르게하는 방법 인 질문의 반대면이 궁금합니다.

Quantified Self 웹 사이트 에서 저자는 시간이 지남에 따라 스스로 측정 된 일부 측정 결과에 대한 실험 결과를 게시하고 갑자기 커피를 마시기 전과 후에 비교했다. 결과는 주관적으로 평가되었으며 저자는 시계열에 변화가 있으며 정책의 변화 (음료 커피)와 관련된 증거가 있다고 믿었습니다.

이것이 생각 나게하는 것은 경제 모델입니다. 우리는 하나의 경제 (현재 우리가 걱정하는 것) 만 가지고 있기 때문에 경제학자들은 종종 본질적으로 n = 1 실험을하고 있습니다. 이로 인해 데이터는 시간이 지남에 따라 거의 자동으로 상관됩니다. 경제학자들은 연준이 정책을 시작하고 정책에 따라 시계열이 바뀌 었는지 여부를 결정하려고 할 때 일반적으로보고있다.

데이터를 기반으로 시계열이 증가 또는 감소했는지 확인하기위한 적절한 테스트는 무엇입니까? 얼마나 많은 데이터가 필요합니까? 어떤 도구가 있습니까? 내 초기 인터넷 검색은 Markov 스위칭 시계열 모델을 제안하지만 내 인터넷 검색 기술로는 기술 이름만으로 아무것도 할 수 없습니다.

답변:


4

Jason이 언급 한 Box-Tiao 논문은 알려진 법률 변경에 근거한 것입니다. 여기서 문제는 특정 시점을 감지하는 방법입니다. 정답은 Tsay 프로 시저를 사용하여 펄스, 레벨 시프트, 계절 펄스 및 / 또는 로컬 시간 추세 인 간섭을 감지하는 것입니다.


1

구조적 중단에 대한 오래된 노트를 살펴보면 다음 두 가지 인용이 있습니다.

엔더, "Applied Econometric 시계열", 2 판, ch. 5.

엔더는 중재, 펄스 기능, 점진적 변경 기능, 전달 기능 등에 대해 설명합니다.

박스, GEP 및 GC 티아 오. 1975.“경제 및 환경 문제에 대한 응용을 통한 개입 분석.”Journal of the American Statistical Association 70 : 70-79.


1

변경점 모델을 사용한 다음 Gibbs Sampling과 같은 MCMC 알고리즘을 사용하여 변경점을 식별 할 수 없습니까?

데이터에 대한 일부 사전 배포 또는 전체 조건부 차이 (Gibs의 경우)가있는 경우 구현하기가 비교적 간단해야합니다.

여기서 빠른 개요를 찾을 수 있습니다


1

모든 시점을 후보 변경점 (일명 중단 점, 구조적 변경)으로 고려하는 경우 strucchange 패키지는 매우 좋은 옵션입니다.

특정 시나리오에서는 후보 시점이 하나만있는 것 같습니다. 이 경우 몇 가지 빠른 옵션이 떠 오릅니다.

  1. T- 테스트 : "종료 전"대 "종료 후"기간에 하루 집중 시간에 대한 t- 시험. 일상적인 상관 관계가 염려된다면, 더 이상 상관 관계가 없다고 생각할만큼 충분한 간격을 갖도록 관찰을 포기할 수 있습니다. 이 접근 방식을 사용하면 단순성과 힘을 교환 할 수 있습니다.
  2. AR : "종료 후"더미 하나를 가진 AR 모델에 적합합니다. 예측 변수가 유의하면 변화가 있습니다. AR을 사용하면 일 간의 (가능한) 의존성을 캡처합니다.

: John 아이디어는 "하나의 후보 시점"을 모르지만 문자 그대로 수백 개의 시계열에 대해 분석적으로 찾고자한다는 것입니다. 이 한 후보를 결정하기위한 "눈 테스트"는 종종 일회성 펄스 및 기본 ARIMA 구조가 막힐 때 부족합니다. 중재 탐지 방법 알 수없는 LEVEL / STEP 이동을 검색하는 la R. Rsay 또는 George Tiao는 실제로 설명하는 변수를 구성합니다 (0이 1 인 더미, 1이옵니다). Interventions FIRST를 식별 한 다음 ARIMA 구성 요소를 식별하는 데주의를 기울여야합니다.
IrishStat

@IrishStat : 참조 된 블로그에서 변경 지점이 알려져 있습니다. 그렇지 않은 경우 strucchange R 패키지가 참조되었습니다.
JohnRos

: John 구조 변경 문서에서 "마지막으로, 구조적 변화가있는 회귀 모델의 중단 점은 친숙한 CHOW 방법을 사용하여 추정 할 수 있습니다."회귀 계수에서 중단 점을 테스트하거나 찾으려면 회귀 모델의 스펙이 필요합니다. "데이터를 기반으로 시계열이 증가 또는 감소했는지 확인하기위한 테스트"라는 질문에 답하는 것과는 아무런 관련이 없습니다. OP의 질문에 대답하기에 귀하의 권장 사항이 충분하지 않다고 생각합니다. 믿었다.
IrishStat

: john 인터셉트 만있는 모델은 교과서 나 꿈에서만 발견되므로 사실이지만 사소한 것입니다.
IrishStat

@IrishStat : 구조 변경 프레임 워크가 더 일반적이라는 것이 사실입니다. 그러나 "데이터"의 증가 또는 감소를 감지하는 것은 인터셉트 전용 모델을 피팅하여 수행 할 수 있습니다.
JohnRos

1

몇 년 전에 저는 지역 ASA 지부 회의 에서 대학원생 인 Stacey Hancock 의 연설을 들었으며 시계열의 "구조적 휴식 추정"에 관한 것이 었습니다. 그 이야기는 정말 흥미로 웠고 나중에 그녀와 이야기를 나 Richard으며 그녀는 Richard Davis ( Brockwell-Davis )와 콜로라도 주립 대학 (Columbia State University), 현재 콜롬비아 (Columbia)에서 일하고있었습니다. 이 대화는 Davis et al. Nonstationary 시계열 모델에 대한 Strutural Break Estimation 이라는 2006 JASA 논문에서 작업 할 수 있습니다 .

Davis는 자신이 Windows 실행 파일로 만든 Auto-PARM이라고하는 방법을 소프트웨어로 구현했습니다. 당신이 그에게 연락하면 사본을 얻을 수 있습니다. 사본이 있는데 여기에 1,200 개의 관측 시계열에 대한 예제 출력이 있습니다.

    ============== RESULTS ===============
  ISLAND           1
    SC=   1910.58314770669
    Breaking point/AR order
           1              1
         351              1
         612              3
    ======================================
 Total time:   5.812500

따라서이 계열은 처음에 AR (1)이며 관측치 351에서 AR (1) 프로세스가 다른 AR (1) 프로세스로 변경되고 (매개 변수를 얻을 수 있음) 관찰 612에서 프로세스가 AR (3)으로 변경됩니다. .

내가 Auto-PARM을 시도한 흥미로운 설정 중 하나는 NN5 경쟁의 일부인 주간 ATM 인출 데이터를 보는 입니다. 나는 미국 연말 쇼핑 시즌의 시작과 같이 주어진 해 11 월 말에 구조적 중단을 찾는 알고리즘을 기억합니다.

그렇다면 기존 구현을 통해이 알고리즘을 사용하는 방법은 무엇입니까? 다시 한 번 Davis에게 연락하여 Windows 실행 파일을 얻을 수 있는지 확인할 수 있습니다. 내가 Rogue Wave Software에있을 때 Davis와 함께 Auto-PARM을 IMSL Numerical Libraries로 가져 왔습니다. 포팅 된 첫 번째 언어는 Fortran 인데, 여기서 Auto_PARM이라고 불리우는 데, Rogue Wave가 곧 C, C 포트, Java 포트와 함께 C 포트를 출시 할 것으로 보입니다.


: Josh he는 내 의견으로는 AR (3)이 시간이 지남에 따라 일정한 매개 변수를 갖는지 여부에 대한 모델 매개 변수 불변성의 가설 테스트를 언급하지 않았습니다. He는 지금까지 잔차 평균의 미지의 변화를 감지하는 데 흥미가 있다고 생각합니다.
IrishStat

mods : OP는 내 의견으로는 모델 매개 변수 불변성의 가설을 테스트하는 것을 언급하지 않았으며, 귀하의 경우 notan AR (3)에 시간이 지남에 따라 일정한 매개 변수가 있는지 여부는 이전의 평균에서 알 수없는 변화를 감지하는 데 관심이 있다고 생각합니다 잔차. 이것은 당신이 언급 한 것과는 상당히 다른 문제입니다. 이제 잔차의 평균에 개입 탐지가없는 경우 일부 모델의 매개 변수 및 / 또는 분산이 특정 시점을 찾을 수 있음에 전적으로 동의합니다. 그러나 OP가 찾고자하는 것이 아니라 오류가 크게 변경되었을 수 있습니다.
IrishStat

@IrishStat : Auto-PARM에 익숙하십니까? 이 알고리즘은 브레이크 추정에서 잔차를 사용합니다 (두 개의 브레이크 횟수 및 세그먼트의 AR (p) 순서와 관련하여). OP는 그가 요구하는 특정 방법을 가지고 있지 않은 것 같습니다. 오히려 그는 매우 일반적으로 "시간 내에 프로세스를 측정하고 프로세스에 대해 무언가를 변경하는 경우 데이터만으로이 변화 지점을 감지 할 수있는 방법이 있습니까?"라고 묻고있는 것 같습니다. 그는 레벨 시프트 대 혁신 대 첨가제 이상치 탐지에 대해 묻지 않습니다. OP가 우리를 위해 분명히 할 수 있기를 바랍니다 ...
Josh Hemann

josh : OP의 "데이터를 기반으로 시계열이 증가 또는 감소했는지 확인하기위한 적절한 테스트는 무엇입니까?" 이것은 잔차의 평균이 일부 ARIMA 모델의 매개 변수가 아닌지 결정을 요구한다고 생각합니다. 제 생각에는 잘못된 소프트웨어 / 솔루션 절차를 추천하고 있지만 그것은 제 의견입니다.
IrishStat

1

조쉬는 말했다 :

josh : OP의 "데이터를 기반으로 시계열이 증가 또는 감소했는지 확인하기위한 적절한 테스트는 무엇입니까?" 이것은 잔차의 평균이 일부 ARIMA 모델의 매개 변수가 아닌지 결정을 요구한다고 생각합니다. 제 생각에는 잘못된 소프트웨어 / 솔루션 절차를 추천하고 있지만 그것은 제 의견입니다. – IrishStat 10 월 28 '11 일 19:08

AR (1) 모델로 시작한다고 가정합니다.

와이=γ+ϕ와이1+이자형

이자형σ2

γ1h나는

γϕ

구조 모델을 가정하면 Auto-PARM이 사용되는 절차입니다.


1
실제로 IrishStat를 인용하는 것처럼 보입니다 ... 견적의 원래 출처를 연결해 주시겠습니까?
Nick Stauner
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.