머신 러닝을 발견하면 다음과 같은 흥미로운 기술이 나타납니다.
- 자동 같은 기법 튜닝 알고리즘
grid search
, - 동일한 "유형"의 서로 다른 알고리즘을 조합하여보다 정확한 결과를 얻을 수 있습니다
boosting
. - 서로 다른 알고리즘 (동일한 유형의 알고리즘은 아님)의 조합을 통해보다 정확한 결과를 얻을 수 있습니다
stacking
. - 아마 더 많은 것을 여전히 발견해야 할 것입니다 ...
내 질문은 다음과 같습니다. 모든 조각이 있습니다. 그러나 입력 정리 데이터로 사용하고 모든 기술을 최대한 활용하여 좋은 결과를 출력하는 알고리즘을 만들기 위해 그것들을 조합 할 수 있습니까? (물론 전문적인 데이터 과학자보다 효율성이 떨어질 수 있지만, 나보다 더 나을 것입니다!) 그렇다면, 샘플 코드가 있거나 그렇게 할 수있는 프레임 워크를 알고 있습니까?
편집 : 일부 답변 후 일부 축소를 수행해야합니다. 예를 들어, 범주 형 데이터가 포함 된 하나의 열이 있고,이를 호출하고 더미 또는 실제 숫자 데이터 (높이, 온도) 인 y
숫자 데이터에서 예측하려고합니다 X
. 청소가 이미 완료된 것으로 가정합니다. 이러한 데이터를 가져 와서 예측을 출력 할 수있는 기존 알고리즘이 있습니까? (여러 알고리즘을 테스트하고, 조정하고, 부스팅하는 등의 방법으로) 예인 경우, 계산 효율성이 높으며 (일반 알고리즘과 비교할 경우 합리적인 시간에 계산이 수행됩니까) 코드 예제가 있습니까?
auto.arima
에서 ( forecast
도서관의) 예측 이 인간보다 낫습니다. 따라서 어떤 종류의 "자동 학습"이 성공적으로 적용되는 영역이 있습니다.