머신 러닝을위한 클라우드 컴퓨팅 플랫폼


36

Amazon EC2를 기반으로 구축 된 클러스터에서 R, python 또는 octave 스크립트를 실행하기위한 플랫폼을 제공하는 작은 회사 목록이 있습니다. 추가해야 할 다른 이름이 있습니까?

  1. 구름 번호
  2. 오 파니
  3. crdata


이 블로그 게시물에서 더 많은 옵션을 찾을 수 있습니다. blog.uruit.com/getting-started-with-machine-learning-2
Regiane Folter

답변:


15

나는이 회사를 사용하지 않았지만 옵션 중 일부 일뿐입니다. 그러나 EC2 설정은 매우 간단합니다. 적어도 머리를 벽에 대고 세게 두드려서 충분히 자주 그리고 자주 뭉친 후에 머리를 마비시켰다. 또한 통증 역치를 증가시킵니다. 요즘 아이들은 훨씬 쉬워요. 내가 시작했을 때, 우리는 포그 컴퓨팅을하고있었습니다. 우리는 우리가 계산하는 것을 가장 포기하지 않았습니다.

회상은 제쳐두고 ... 이러한 벤더를 우회하고 스스로 시작할 수있는 툴과 리소스가 있습니다. JD Long을segue 사용하면 EMR에서 R을보다 쉽게 ​​사용할 수 있습니다.

Python과 관련하여 boto 는 EC2에서 Python을 쉽게 시작하고 실행할 수있는 제품군입니다. EC2 대안을 고려하고 싶다면 Google의 AppEngine 에서 Python을 시작하고 실행하는 것이 매우 쉽습니다 . Python을 알고 있다면 개념 수준에서도 스케일링, 샤딩,로드 밸런싱 등에 익숙하지 않은 경우 회사를 고용하여 리프팅을 할 필요가 없습니다. 다른 한편으로, 그러한 서비스에 많은 돈을 소비하는 것을 고려하고 있다면 코드를 효율적으로 만드는 방법에 익숙해지는 것이 좋습니다.

클라우드상의 Octave는이 세 회사 외에 무엇이 존재하는지 전혀 모른다. 이전에는 Monkey Analytics가 제공했지만 사라진 것 같습니다. Octave를 피하고 Python 또는 R에 집중하는 것이 좋습니다.

보다 쉽게 ​​설정할 수있는 리소스 중 하나는 StarCluster 입니다. 다시 한번, 그들에 대한 경험은 없지만 도움이 될 수 있습니다.

모든 정직에서 우분투 (또는 Windows)와 EC2는 배우기가 어렵지 않습니다. R 개발자와 Windows 사이에 많은 사랑이 없기 때문에 R for Windows를 실제로 권장하지는 않습니다. (NB : 내가 말할 수있는 한, 심각한 Mac OS X 클라우드 서비스는 없다.) 일단 원격 데스크톱이 있으면 사업을 시작한다. 확장 방법을 배우는 것이 다음 단계입니다.


업데이트 1 : 기타 일반적인 클라우드 관리 서비스에는 RighstScale 및 Scalr이 포함됩니다.

업데이트 2 : 클라우드에 인스턴스 및 클러스터를 설정하는 방법을 배우는 것이 중요하다는 점을 강조하고 싶습니다. 실습의 장점 중 :

  • 다양한 리소스 (여러 인스턴스, 여러 인스턴스 유형, 많은 HD, 다양한 가용 영역 또는 리전, 다양한 모니터링 도구 등)를 관리하는 방법에 대해 알아보십시오.
  • 원하는 경우 GPU가있는 땜장이 (체크 아웃 gputools)
  • 선택한 패키지를보다 쉽게 ​​업데이트하거나 롤백 할 수 있습니다.
  • 스팟 인스턴스 또는 예약 인스턴스를 사용하면 훨씬 더 저렴한 비용을 얻을 수 있습니다.
  • 다른 R GUI 또는 IDE를 사용해 볼 수 있습니다. 클라우드 공급 업체에게는 옵션이 아닐 수 있습니다.

학습 곡선 단축, 그룹 간 리소스 공유에 대한 더 나은 지원 및 기즈모와 같은 관리 형 공급자를 사용하면 이점이 있지만, 이러한 기능을 사용하기 전에 EC2를 사용하기 시작했을 때 이점에 대해 이야기 할 수 없습니다 시장에왔다.


5

EC2에서 Python 코드를 병렬로 실행하기위한 PiCloud 도 있습니다 .

자신의 제품 페이지 :

PiCloud는 Python Programming Language에 통합되는 클라우드 컴퓨팅 플랫폼입니다. 가상 서버를 관리, 유지 관리 또는 구성 할 필요없이 Amazon Web Services의 컴퓨팅 성능을 활용할 수 있습니다.

PiCloud는 맞춤형 Python 라이브러리 인 클라우드를 통해 기존 코드베이스에 완벽하게 통합됩니다. 함수 실행을 서버로 오프로드하려면 원하는 기능을 클라우드 라이브러리로 전달하기 만하면됩니다. PiCloud는이 기능을 고성능 클러스터에서 실행합니다. 더 많은 기능을 실행하면 클러스터 요구 사항에 맞게 클러스터가 자동 확장됩니다. 클라우드를 이용하는 것은 결코 쉬운 일이 아닙니다!


나는 PiCloud를 좋아합니다. 시작 및 실행이 매우 쉽다는 것을 알았습니다.
Fomite

3

CloudStat를 전에 사용해 보셨습니까 ? 다른 클라우드와 달리 CloudStat은 R 언어 사용자만을위한 것입니다. 더 이상 설정이 없습니다. 로그인하여 최대 7.5Gb RAM까지 무료로 사용할 수 있습니다.

그러나 무료 계정을 사용하면 분석을 공개적으로보고 사용할 수 있습니다. 옵션은 매월 $ 5를 지불하여 분석을 비공개로 만듭니다.


0

제가 추천 할 수있는 클라우드 컴퓨팅 플랫폼 중 하나 는 안전한 생산성 향상 클라우드 컴퓨팅 플랫폼 을 제공하는 Backbone 입니다 .


그들은 R 특정 제품을 가지고 있습니까? 나는 일반적인 클라우드 컴퓨팅 공급자를 찾고 있지 않고 미리 구성된 R (바람직하게는 RStudio) 서버를 제공하는 것을 찾고 있습니다.
Zach

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.