패널 데이터를위한 기계 학습 알고리즘


12

이 질문에서- 구조적 / 계층 적 / 다단계 예측 변수를 고려한 의사 결정 트리를 구성하는 방법이 있습니까? -그들은 나무에 대한 패널 데이터 방법을 언급합니다.

Vector Machines 및 Neural Networks를 지원하기위한 특정 패널 데이터 방법이 있습니까? 그렇다면 알고리즘 및 구현 가능한 경우 R 패키지에 대한 몇 가지 논문을 인용 할 수 있습니까?


1
나는 당신이 이것으로 무엇을 사용하기로 결정했는지 궁금했습니다. 비슷한 문제를 해결하려고합니다.
user0

답변:


1

LSTM (Long Short Term Memory)이 관련이있을 수 있습니다. 이 유형의 모델은 여러 시점에서 여러 기능을 처리 할 수 ​​있으므로 패널 데이터에 적합해야합니다. 여기 LSTM의 개념에 아주 좋은 설명이고, 여기 패키지입니다 구현 LSTM의 R 버전.


1

패널 데이터가있는 경우 시계열 분류 / 회귀 또는 패널 예측과 같이 해결하려는 다른 작업이 있습니다. 그리고 각 작업마다이를 해결하기위한 수많은 접근 방식이 있습니다.

기계 학습 방법을 사용하여 패널 예측을 해결하려는 경우 여러 가지 방법이 있습니다.

입력 데이터 (X), 단위 (예 : 국가, 개인 등)를 iid 샘플로 취급하면

  • 시계열을 구간 화하고 모든 구간에 대해 동일한 구간을 사용하여 시간 순서를 무시하고 각 구간을 별도의 열로 처리합니다. 구간 크기는 물론 관찰 된 시계열 측정 일 수도 있고 더 큰 구간으로 업 샘플링 및 집계 할 수 있습니다. 테이블 형식 데이터에 표준 기계 학습 알고리즘을 사용합니다.
  • 또는 각 단위의 시계열에서 기능을 추출하고 추출 된 각 기능을 별도의 열로 사용하고 표준 표 알고리즘과 다시 결합합니다.
  • 또는 연속 또는 범주 형 시계열 데이터를 관찰하는지에 따라 특수한 시계열 회귀 / 분류 알고리즘을 사용합니다. 여기에는 시계열과 시계열을 비교하는 특수 커널이있는 지원 벡터 시스템이 포함됩니다.

출력 데이터 (y)와 관련하여 향후 여러 시점을 예측하려는 경우 다음을 수행 할 수 있습니다.

  • 항상 동일한 입력 데이터를 사용하여 예측하려는 각 단계에 대해 추정기를 맞 춥니 다.
  • 또는 제 1 단계에 대해 예측기에 단일 추정기를 맞추고, 제 1 단계 예측을 사용하여 관측 된 입력 데이터에 부가하여 제 2 단계 예측 등을 수행하는 등 입력 데이터를 시간에 롤링 (roll) 할 수있다.

위의 모든 접근법은 기본적으로 패널 예측 문제를 시계열 회귀 또는 표 회귀 문제로 줄입니다. 데이터가 시계열 또는 표 형식의 회귀 형식이되면 사용자에게 시변이없는 기능을 추가 할 수도 있습니다.

물론 패널 예측 문제를 해결하기위한 다른 옵션이 있습니다 (예 : 패널 데이터에 맞게 조정 된 ARIMA와 같은 고전적인 예측 방법 또는 시퀀스 대 시퀀스 예측을 직접 수행 할 수있는 딥 러닝 방법).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.