R에서 최근 관측치에 더 많은 가중치를 할당하려면 어떻게해야합니까?
나는 이것을 일반적으로 묻는 질문이나 욕망으로 생각하지만 이것을 구현하는 방법을 정확히 알아내는 데 어려움을 겪고 있습니다. 나는 이것을 많이 찾으려고 노력했지만 좋은 실제 예를 찾을 수는 없다.
내 예에서는 시간이 지남에 따라 큰 데이터 세트가 있습니다. 최신 데이터 행에 일종의 지수 가중치를 적용하고 싶습니다. 따라서 2015 년의 관측치가 2012 년의 관측치보다 모형을 훈련시키는 데 더 중요하다는 일종의 지수 함수가 있습니다.
내 데이터 세트 변수에는 범주 값과 숫자 값이 혼합되어 있으며 내 목표는 숫자 값입니다.
CARET 패키지에서 GBM / Random Forest와 같은 모델을 사용하여 이것을 테스트 / 시도하고 싶습니다.
업데이트 질문
두 지점 사이의 날짜 거리에 따라 가중치를 기하 급수적으로 감쇠시키는 방법에 대한 아래의 답변에 감사드립니다.
그러나 캐럿에서이 모델을 훈련 할 때 가중치가 정확히 어떻게 반영됩니까? 각 교육 행의 가중치는 미래의 특정 지점과 그 지점이 이전에 발생한 시점 사이의 거리입니다.
가중치는 예측 중에 만 작용합니까? 그들이 훈련 중에 게임을 시작한다면, 다양한 크로스 폴드가 다양한 무게를 가지기 때문에 모든 종류의 문제를 일으키지 않을 것입니다.