이것은 내 훈련 데이터입니다 : 200,000 예제 x 10,000 기능. 내 훈련 데이터 매트릭스는-200,000 x 10,000입니다.
각 예제의 기능을 생성 할 때마다 모든 데이터 세트를 하나씩 저장하여 메모리 문제없이 플랫 파일로 저장했습니다.
그러나 이제 Milk , SVM light 또는 기타 기계 학습 알고리즘을 사용하면 모든 것이 학습 데이터 대신 하나씩 전체 교육 데이터를로드하려고 시도합니다. 그러나 나는 단지 8GB RAM을 가지고 있으므로이 방법으로 진행할 수 없습니다.
어쨌든 하나의 데이터 세트로 하나의 데이터 세트로 알고리즘을 학습 할 수 있다는 것을 알고 있습니까? 즉, 교육하는 동안 언제든지 하나의 데이터 세트를 메모리에로드 할 수 있습니다.