다른 파일에서 많은 양의 CSV 데이터를 읽은 다음 svm과 같은 기계 학습 작업을 수행하기위한 R 스크립트가 있습니다.
R의 서버에서 다중 코어를 사용하기위한 라이브러리
가 있습니까?
또는
이를 달성하기위한 가장 적합한 방법은 무엇입니까?
다른 파일에서 많은 양의 CSV 데이터를 읽은 다음 svm과 같은 기계 학습 작업을 수행하기위한 R 스크립트가 있습니다.
R의 서버에서 다중 코어를 사용하기위한 라이브러리
가 있습니까?
또는
이를 달성하기위한 가장 적합한 방법은 무엇입니까?
답변:
GNU / Linux를 사용한다면 Shane과 Dirk의 이전 답변이 훌륭합니다.
Windows 용 솔루션이 필요한 경우이 게시물에 하나가 있습니다.
패키지는 아직 CRAN에 없습니다. 해당 링크에서 다운로드 할 수 있습니다.
셰인이 맞습니다. 모두 멀티 코어 및 Rmpi은 승자입니다.
주제의 약간 더 넓은 범위는 고성능 컴퓨팅에 대한 CRAN 태스크보기에 있습니다. 이것은 또한 JSS의 R 을 사용한 병렬 컴퓨팅 에 관한 최근의 조사 기사로 연결됩니다 .
마지막으로, 몇 가지 실습 예제와 팁에 R과 HPC에 소개 내 볼 - 나는 가끔주고 튜토리얼 프리젠 테이션 페이지의 사용자에 지난 주 가장 최근의 사본.
이전 답변에는 일반적인 HPC 고려 사항이 부족한 것으로 나타났습니다.
우선, 이러한 패키지 중 어느 것도 하나의 SVM을 병렬 로 실행할 수 없습니다 . 따라서 속도를 높일 수있는 것은 매개 변수 최적화 또는 교차 유효성 검사이지만 여전히 해당 기능을 직접 작성해야합니다. 또는 경우에 따라 다른 데이터 세트에 대해 작업을 병렬로 실행할 수도 있습니다.
두 번째 문제는 메모리입니다. 몇 대의 실제 컴퓨터에 계산을 분산 시키려면 무료 점심 식사가 없으며 데이터를 복사해야합니다. 여기서 일부 통신을 저장하기 위해 컴퓨터에 데이터 사본을 사전 분배하는 것이 적절한 지 고려해야합니다. 반면에 한 컴퓨터에서 여러 코어를 사용하려는 경우 멀티 코어는 모든 하위 프로세스가 상위 프로세스의 메모리에 액세스 할 수 있으므로 시간과 많은 메모리 공간을 절약 할 수 있기 때문에 특히 적합합니다.
sprint
R 용 패키지 가 psvm
있지만 R 3.0 변경 사항 및 새로운 CRAN 제출 지침을 따르는 데 약간 뒤쳐져 있으므로 현재 다운로드 를 CRAN에서 사용할 수 없거나 R 3.0과 완전히 호환되지 않습니다. 귀하의 마일리지가 다를 수 있습니다.
셰인과 더크의 반응이 모두 주목을 받고 있습니다.
그럼에도 불구하고 빅 데이터 세트를 처리하고 여러 코어에서 실행되도록 설계된 Revolution R 이라는 상용 버전의 R을 살펴볼 수 있습니다 . 이 소프트웨어는 학자에게 무료입니다 (귀하의 경우 일 수도 있습니다)