연도 별 주식 지표 수익률이 미달 된 (12 개월) 회귀하는 회귀 모델을보고 있습니다. 동일한 주가 지수의 연도 별 수익률, 신용 스프레드 (매월 무위험 채권의 평균과 회사채의 차이) 생산량), YoY 인플레이션 율 및 산업 생산의 YoY 지수.
따라서이 경우 모양이 보입니다 (이 경우 인도 고유의 데이터를 대체 할 수는 있음).
SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)
SP500YOY는 SP500 지수에 대한 전년 대비 수익입니다.이를 계산하기 위해 월 평균 SP500 값을 계산 한 다음 매월 1 년마다 연도 별 수익으로 변환합니다 (예 : Jan'10-Jan'11, Feb'10- Feb'11, Mar'10-Mar'11,… 설명 변수 측면에서 SP500YOY의 12 개월 지연 값은 시간 T 및 INFLATION 및 INDUSTRIALPRODUCTION 2주기 AHEAD에서 CREDITSPREAD와 함께 사용됩니다. INFLATIONASYMM은 인플레이션이 5.0 %의 임계 값을 초과하는지 여부에 대한 더미입니다. 괄호 안의 색인은 각 변수의 시간 색인을 보여줍니다.
이것은 표준 OLS 선형 회귀에 의해 추정됩니다. SPOY의 1,2 및 3 개월 전 YOY 수익을 예측하기 위해이 모델을 사용하려면 인플레이션 및 산업 생산 지수에 대한 3,4 및 5 개월 사전 예측을 생성해야합니다. 이 예측은 ARIMA 모델을 두 개 각각에 개별적으로 맞춘 후에 수행됩니다. 1,2 및 3 개월 전의 CreditSpread 예측은 단지 정신적 인 추정치로 던져집니다.
이 OLS 선형 회귀가 정확 / 잘못된, 효율적 / 비효율적이거나 일반적으로 유효한 통계 관행인지 알고 싶습니다.
내가 보는 첫 번째 문제는 겹치는 데이터를 사용하는 것입니다. 즉, 주가 지수의 일일 가치는 매월 평균을 계산 한 다음 월별 롤오버되는 연간 수익을 계산하는 데 사용됩니다. 이는 오류 용어를 자동 상관 관계로 만들어야합니다. 다음 중 하나의 줄에 '수정'을 사용해야한다고 생각합니다.
- 화이트의 이분산성 일관성 공분산 추정기
- Newey & West 이분산성 및 자기 상관 일관성 (HAC) 추정기
- Hansen & Hodrick의 이분산성 일관성 버전
겹치는 데이터에 표준 OLS 선형 회귀를 적용하고 (교정없이), 더 많은 경우, SP500YOY 예측을 위해 원래 OLS 선형 회귀에서 사용할 설명 변수에 대해 3주기 선행 ARIMA 예측을 사용하는 것이 실제로 의미가 있습니까? 나는 이전에 그러한 형태를 보지 못했기 때문에 겹치는 관측의 사용을 수정하지 않는 한 실제로 판단 할 수는 없습니다.