정규화 또는 벌칙을 적용하여 ARIMAX 모델 피팅 (예 : 올가미, 탄성 그물 또는 릿지 회귀)


29

내가 사용 auto.arima () 의 기능을 예측 공변량의 다양한 ARMAX 모델에 맞게 패키지로 제공된다. 그러나 종종 선택할 변수가 많으며 대개 하위 집합으로 작동하는 최종 모델로 끝납니다. 나는 인간이고 편견의 영향을 받기 때문에 변수 선택에 대한 임시 기술을 좋아하지 않지만 교차 유효성 검사 시계열은 어렵 기 때문에 사용 가능한 변수의 다른 하위 집합을 자동으로 시도하는 좋은 방법을 찾지 못했습니다. 내 자신의 최고의 판단을 사용하여 내 모델을 조정하는 중입니다.

glm 모델에 적합하면 glmnet 패키지 를 통해 탄성 그물 또는 올가미를 사용하여 정규화 및 변수를 선택할 수 있습니다. ARMAX 모델에서 탄력적 네트를 사용하기위한 R의 기존 툴킷이 있습니까? 아니면 직접 롤링해야합니까? 이것도 좋은 생각입니까?

편집 : AR 및 MA 항 (AR5 및 MA5까지)을 수동으로 계산하고 모델에 맞게 glmnet을 사용하는 것이 합리적입니까?

편집 2 : FitAR 패키지가 나에게 모든 것을 제공하는 것은 아니라고 생각합니다 .


2
이 문제에 대해 무언가를 할 수 있었는지 궁금합니다. 나는 모든 업데이트를 표시했습니다. 그래서 여기를 만지면됩니다.
Vishal Belsare

이 문제를 해결하기 위해 노력하지 마십시오. 나는 내 자신의 구현을 작성하는 것에 대해 생각했지만 그것을 얻지 못했습니다. AR 및 MA 항을 수동으로 계산 한 다음 해당 데이터에 glmnet을 적용 할 수 있습니까?
Zach

1
Zach 안녕, 나는 당신이 이것을 더 가지고 있는지 또는 아직도 주차되어 있는지 궁금했다. 많은 수의 계열을 예측하기 위해 그러한 알고리즘이 필요합니다.
매트 웰러

3
@MattWeller 나는 forecastR을위한 훌륭한 패키지 의 저자 인 Rob Hyndman과 약간 이야기 를했다. 그는 비선형 ARIMA 옵티 마이저를 올가미로 감싸 야하므로 전체 ARIMA 로는 어려울 것이라고 말했다. 하나의 부분 솔루션은 glmnet지연 변수를 사용하여 AR 모델을 맞추는 것 입니다. 내가 아는 한 아직 아무도 완전한 ARIMA 모델로이 작업을 수행하지 않았습니다.
Zach

답변:


7

이것은 해결책이 아니라 내가 아는 가능성과 어려움에 대한 성찰입니다.

Yt+1=xtβ+ϵt+1
xtβxt

Yt+1=f(xt,β)+ϵt+1
β
Yt+1=xtg(β)+ϵt+1
βg(β)

또 다른 문제는 벌칙 금액 (조정 매개 변수)을 선택하는 것입니다. 일반적으로 시계열에는 일종의 교차 유효성 검사가 필요하지만 특정 모델에 대해 계산이 덜 필요한 몇 가지 방법을 해결할 수 있기를 바랍니다.


R의 caret 패키지에는 glmnet의 매개 변수를 선택하는 데 사용할 수있는 시계열 교차 검증이 잘 구현되어 있습니다. 답변 해주셔서 감사합니다.
Zach

2

나는 클라이언트 가이 문제를 자동 즉 턴키 방식으로 해결하도록 도전했습니다. 나는 각 쌍 (즉, y와 후보 x)에 대해 사전 미백, 사전 미백 된 시리즈의 상호 상관을 계산하고, 간섭 탐지를 강력한 추정치를 산출하고이 구조에 대한 "측정"을 개발하십시오. 모든 후보 회귀 분석에 대해이를 수행 한 후 "측정"별로 순위를 매기고 "측정"에 따라 상위 K 회귀 분석기를 선택하십시오. 이를 때때로 선형 필터링이라고합니다. 이 휴리스틱을 상용 시계열 패키지에 성공적으로 통합했습니다. "자신의 롤링"이 가능해야합니다


특히 올가미 또는 탄성 그물을 ARIMA 모델에 통합하고 싶습니다.
Zach

3
나는 실제로 선형 필터를 찾고 있지 않습니다 (이것이 유용하지만). 특히 올가미, 능선 회귀 또는 탄성 그물을 ARIMAX 모델에 통합하는 방법을 원합니다.
Zach

2
현재로서는 레벨 이동, 로컬 시간 추세, 계수 이동 또는 일정하지 않은 오류 분산에 관심이 없습니다. 나는 특히 올가미, 릿지 또는 탄성 그물 정규화를 ARIMAX 모델에 적용하는 데 관심이 있습니다.
Zach

2
올가미, 릿지 또는 탄력적 순 정규화를 위의 방법론에 통합하고 오픈 소스 프로그래밍 언어로 예제 코드를 게시 할 수 있다면 현상금을 기꺼이 수여합니다.
Zach

1
@frank 당신은 추정 (강압)을 통해 식별을 시도하고 있으며 가능한 펄스, 레벨 시프트, 계절 펄스 및 시간 추세의 조합이 많기 때문에 작동하지 않습니다. 이러한 구조가 필요하지만 무시되면 매개 변수 추정이 바이어스되고 매개 변수 유의성 검정이 창 밖으로 나옵니다.
IrishStat
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.