예측 모델의 반응 변수가 다른 경우 예측을 결합하는 방법은 무엇입니까?


9

소개

예측 조합에서 인기있는 솔루션 중 하나는 일부 정보 기준의 적용을 기반으로합니다. 예를 들어 모델 대해 추정 된 Akaike 기준 를 하면 와 의 차이 를 와 계산 한 다음 RP_j = e ^ {(AIC ^ *-AIC_j) / 2} 를 다음과 같이 해석 할 수 있습니다. 모델 j 의 상대 확률이 실제 확률입니다 . 가중치는 다음과 같이 정의됩니다AICjjAICjAIC=minjAICjRPj=e(AICAICj)/2j

wj=RPjjRPj

문제

내가 극복하려고하는 어려움은 모델이 다르게 변형 된 반응 (내인성) 변수로 추정된다는 것입니다. 예를 들어 일부 모델은 연간 성장률을 기반으로하며 다른 모델은 분기 별 성장률을 기준으로합니다. 따라서 추출 된 AICj 값은 직접 비교할 수 없습니다.

시도 된 솔루션

중요한 것은 AIC 의 차이점이기 때문에 응답 변수 변환에 변하지 않는 기본 모델의 AIC (예 : lm(y~-1)매개 변수없이 모델 을 추출하려고 시도 )를 취한 다음 j 번째 모델과 기본 모델 AIC . 그러나 여기서 약점이 남아있는 것 같습니다. 차이 반응 변수의 변환에 의해 영향을받습니다.

끝 맺는 말

"동일한 반응 변수에서 모든 모델 추정"과 같은 옵션이 가능하지만 시간이 많이 걸립니다. 문제를 해결할 다른 방법이 없다면 고통스러운 결정을 내리기 전에 빠른 "치료"를 검색하고 싶습니다.

답변:


1

모형을 비교하는 가장 신뢰할 수있는 방법 중 하나는 표본 외 오차 (예 : MAE)를 교차 검증하는 것입니다. 사과와 사과를 직접 비교하려면 각 모델에 대한 외인성 변수를 변형 해제해야합니다.


더 많은 시간이 걸리는 접근 방식으로 남은 대안은 잭 나이프 오류를 사용하여 Bates and Granger (1969)와 비슷한 가중치와 Clements and Harvey Forecasts 조합 및 포괄 (2007) 같은 관련 작업을 추정하는 것 입니다. 예측 오차 기반 접근법의 약점은 정보 (모델) 기반 접근법보다 평균적으로 열등하다는 것입니다. 베이지안 평균화는 까다롭기 때문에 유익한 사전 지식을 가진 BMA라고 생각할 수있는보다 간단한 방법을 적용하려고했습니다.
Dmitrij Celov

참고, 나는 그 어느 쪽도 최고의 모델을 비교하고 선택하고자하지 않고 최고의 전망 조합 방법을 찾고 있어요. 나는 다르게 변형 된 반응 변수를 기반으로 모델의 AIC를 비교하는 데 문제가있다 .
Dmitrij Celov

1
@Dmitrij Celov : 그렇다면 왜 AIC를 비교하고 있습니까? AIC는 무조건 교차 검증과 동일하므로 두 메트릭의 비교가 비슷할 것입니다. stats.stackexchange.com/a/587/2817
Zach

@DmitrijCelov : "예측 오류 기반 접근법의 약점은 정보 (모델) 기반 접근법보다 평균적으로 열등하다는 것입니다." 어떤 점에서 열등합니까? 이에 대한 인용이나 설명이 있습니까? 직감은이 말이 틀렸다고 말하지만 직관은 종종 틀렸다 ...
Zach

나는 G.Kapitanious 등의 작업 지 예측 조합과 영국 은행의 통계적 예측 방법 에 대한 발언 후 빠른 결론을 내렸다 . 23 ... "결합 된 예측은 일반적으로 정보를 결합하는 동안 최적의 예측을 제공하지는 않는다"고 기록되어있다. 점근 적 동등성은 거시 경제 데이터의 작은 표본에서 갖고 싶은 것이 아니지만 간단한 방법이 더 복잡 할 수 있습니다. 단순히 교차 검증이 두 번째로 최상의 솔루션이며, 잭 나이프는 1 주일 이내에 생산되며, 한 시간 안에 AIC입니다. (우리는 채팅을 갈 수 있음)
드미트리 Celov에게
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.