@Christopher Lauden이 위에서 언급했듯이 시계열 분석이 이런 종류의 것에 가장 적합합니다. 그러나 더 전통적인 "머신 러닝 방식"을 원한다면 과거에 한 일은 데이터를 기능으로 겹치는 시간 창으로 차단 한 다음 다음 날 (또는 주)을 예측하는 데 사용하는 것입니다. ) 트래픽.
기능 매트릭스는 다음과 같습니다.
t1 | t2 | ... | tN
t2 | t3 | ... | tN+1
t3 | t4 | ... | tN+2
...
tW | tW+1 | ... |tN+W
tI
하루의 트래픽은 어디에 있습니까 I
? 예측할 기능은 마지막 열 다음 날의 트래픽입니다. 본질적으로, 트래픽 창을 사용하여 다음 날의 트래픽을 예측하십시오.
모든 종류의 ML 모델이이 작업에 적합합니다.
편집하다
질문에 대한 응답으로 "이 기능 매트릭스를 사용하는 방법에 대해 자세히 설명 할 수 있습니까?"
기능 매트릭스에는 일정 기간 동안의 과거 트래픽 (예 : 1 주일 별 시간별 트래픽)을 나타내는 값이 있으며,이를 사용하여 향후 특정 기간 동안의 트래픽을 예측합니다. 우리는 과거 데이터를 가져 와서 과거 트래픽의 기능 매트릭스를 작성하고 향후 일정 기간 (예 : 기능에서 창을 표시 한 후 2 일)에 트래픽으로 레이블을 지정합니다. 일종의 회귀 머신 러닝 모델을 사용하여 과거 트래픽 데이터를 가져 와서 과거 데이터 세트에서 트래픽이 어떻게 이동했는지 예측할 수있는 모델을 만들 수 있습니다. 향후 트래픽은 과거 트래픽과 유사 할 것으로 추정됩니다.