I은 설명 변수의 패널을 가정 들어 난 = 1 . . . N , t = 1 입니다. . . T 뿐만 아니라 이진 결과 의존 변수 Y i T 의 벡터 . 따라서 Y 는 최종 시간 T 에서만 관찰되며 이전 시간 에는 관찰 되지 않습니다. 완전히 일반적인 경우 다수 가지고있다 X I J t 용 J = 1 ... K 각각의 단위 I을 각각의 시간에서 t간결성을 위해 케이스 에 초점을 맞추겠습니다 .
시간 상관 상관 설명 변수와 같은 "불균형" 쌍의 적용은 (일일 주가, 분기 배당), (일일 날씨 보고서, 연간 허리케인) 또는 (각 움직임 후의 체위 포지션 특징, 승 / 패 결과) 게임의 끝).
I는 (아마도 비선형)에 관심이 회귀 계수 수행하는 예측 의 Y의 난의 t을 훈련 데이터의 초기 관찰 주어진 것을 알고, X를 전 t 에 t < T , 그것은 최종 결과에 이르게 Y I T
계량 경제학 배경에서 비롯된 회귀 모델링은 이러한 데이터에 적용되는 것을 보지 못했습니다. OTOH, 나는 다음과 같은 머신 러닝 기술이 그러한 데이터에 적용되는 것을 보았습니다.
- 전체 데이터 세트에 대한 지도 학습 수행 ( 예 : 최소화)
단순히으로 전가 / 외삽 관찰 시간에 이전의 모든 포인트
이것은 서로 다른 시점 사이의 시간적 상관 관계를 고려하지 않기 때문에 "잘못된"느낌입니다.
- 학습 매개 변수 α 및 할인 매개 변수 λ를 사용한 시간차와 같은 강화 학습을 수행하고 t = T 에서 시작하는 역 전파를 통해 β t 를 재귀 적으로 해결
함께 의 기울기 F ( ) 에 대하여 β .
이것은 시간 구조를 고려하기 때문에 "정확한"것처럼 보이지만 매개 변수 와 λ 는 일종의 "ad hoc"입니다.
질문 : 위의 감독 / 강화 학습 기술을 고전 통계 / 계량 학에서 사용되는 회귀 프레임 워크에 매핑하는 방법에 대한 문헌이 있습니까? 특히, 나는 모델에 대해 (비선형) 최소 제곱 또는 최대 우도를 수행 하여 "한 번에"(즉, 모든 t = 1 ... T에 대해 동시에) 매개 변수 를 추정 할 수 있기를 원합니다 . 같이
또한 시간차 학습 메타-파라미터 및 λ 가 최대 우도 공식에서 회복 될 수 있는지 여부에 관심 이 있습니다.