많은 RP로 제작 된 슈퍼 컴퓨터는 실용적입니까 아니면 참신한 것입니까?


13

이 질문은 이 기사에서 영감을 얻었습니다 .

현재 저는 데이터를 분석하기 위해 R에서 많은 시간을 보냅니다. R에서 실행하는 일부 스크립트는 시간을 절약하기 위해 병렬 컴퓨팅의 이점을 얻을 수 있습니다. 아마 ~ $ 300에 대한 베어 본 "실제"컴퓨터를 구축 할 수 있고 동일한 $ 300에 대해 6 Pis (전원 케이블 및 SD 카드 포함)를 얻을 수 있다고 가정 해 봅시다. 병렬화에 적합한 작업이 있다고 가정하면 Pis 또는 "실제"컴퓨터를 사용하는 것이 더 좋을까요?

만약 "실제"컴퓨터의 하드웨어를 $ 1000 정도의 비용으로 바꾸면 대답이 바뀔까요?


Pi는 램이 적지 만 Gpu가 좋은 느린 컴퓨터입니다. 당신의 작업이 그로부터 이익을 얻는다면, 그것은 합리적 일 수 있습니다.
Thorbjørn Ravn Andersen 님이

이미 코드가있는 작업을 수행하거나 독점 GPU 프로그래밍 문서에 대한 액세스를 협상 할 수있는 경우에만 GPU가 유용합니다.
Chris Stratton

답변:


10

이것을 분석하려면 20rpis 대 $ 1000라고 말하고 실제로 1000 달러에 실제로 얻을 수있는 것을 스스로 결정해야 합니다 . 이것은 쇼핑 채널이 아닙니다.

~ 1000 달러에 마더 보드, 전원 공급 장치, 8GB 램, 6 코어 3.4Ghz i7 프로세서 및 일부 오래된 하드 드라이브 (여전히 SD 카드보다 빠름)를 얻을 수 있다고 가정합니다. 초당 총주기는 6 * 3.4e9 = 20.4e9이며 파이 수퍼 컴퓨터의 경우 20 * 0.7e9 = 14e9입니다.

이제 멀티 코어 프로세서가 멀티 코어 프로세서라는 사실을 고려하십시오. 반면에 I / O는 (이것이 중요한 요소가되는 경우) 속도가 훨씬 느려질 것입니다.

파이 수퍼 컴퓨터에 대한 관심은 없지만 실험 및 교육용이라고 가정합니다. 확실히 저렴한 클러스터이지만, 실험 및 교육과 달리 숫자를 빠르게 처리 하는 것이 파이 클러스터라면 일반적인 클러스터보다 비용이나 에너지 효과가 더 좋은 방법없습니다 .


감사합니다. "pi 수퍼 컴퓨터의 경우 초당 총 사이클 수는 6 * 3.4e9 = 20.4e9이며 20 * 0.7e9 = 14e9입니다." 기본적으로 내가 쫓아 왔지만 무엇을 찾아야할지 몰랐습니다.
Dean MacGregor

하나의 파이는 5 와트 만 사용합니다. 당신이 그렇게입니다 설명 (20) PIS는 적은 PC보다 100w를 사용하는 것이이 평균은 비용 및 에너지 효율 (미만 CPU와 :))
Thorbjørn Ravn 안데르센

내 경험에 따르면, 8 코어 i7 + SSD 드라이브 + 16GB RAM은 헤드리스 (모니터) 설치의 프로세서로드에 따라 약 50-70Wt를 사용합니다.
lenik

RPi2를 사용하면 사이클 양이 20 * 4 * 0.9e9 = 72e9로 증가하고 오버 클로킹을 사용하면 secound 당 20 * 4 * 1.1e9 = 88e9 사이클에 도달 할 수 있습니다. 이제 pi의 계산 능력이 향상됨에 따라 RPi-Cluster를 구축 할 가치가 있다고 생각하십니까?
Sirac

1
@goldilocks 1) 슈퍼 컴퓨터에 대한 나의 지식은 Mbps 속도에 대해 논쟁하기에 좋지 않습니다. 2) 무엇보다도 Intel-CPU가 동일한 가격으로 ARMv7보다 빠를 수 있습니다. 이에 대한 더 나은 견해를 얻으려면 몇 가지 통계를 찾아야합니다. 3) RPi2에서 커널을 컴파일하는 데 몇 시간이 걸리며 시도했지만 앞으로는 다시 시도하지 않기를 바랍니다. 요약하면 RPi는 RPi2가 아니라 슈퍼 컴퓨터에 완벽한 선택이 아닐 수도 있습니다. 그러나 RPi가 매우 저렴하고 여러 가지를 쉽게 결합 할 수 있기 때문에 좋은 프로젝트를 만듭니다. 나는 당신이 할 수 있기 때문에 네트워크 시뮬레이션을 생각하고 있습니다 ...
Sirac

2

여기에는 다소 복잡한 답변이 있습니다. "기계에 어떤 종류의 작업을 요청하고 있습니까?"

명령어는 컴파일러의 품질뿐만 아니라 다른 머신 (ARM 대 Intel 대 다른 사람)에 걸쳐 설정되므로 실제 성능에 큰 차이가 있습니다. 요청한 작업이 한 시스템에서 하드웨어 가속을 사용하지만 다른 시스템에서는 그렇지 않은 경우, 그 요소만으로도 클럭 속도의 큰 변화보다 더 큰 차이를 만들 것입니다.

가장 일반적인 측면에서, 가격 / 성능 측면에서 가장 큰 벅은 AMD 또는 인텔의 적당히 클럭 된 멀티 코어 일반 CPU에서 나올 것이라고 생각합니다. 주변 온도가 낮은 통제 된 환경에있는 경우 이러한 칩을 약간 오버 클로킹하여 성능을 향상시킬 수 있습니다.

rasPi는 이러한 종류의 물건을 위해 설계되지 않았으므로 일이 어떻게 작동하는지 배우고 매우 저렴한 가격으로 진정으로 "분산 된"시스템을 구축하는 데있어 높은 가치에서 벗어나지 않아야합니다. 그러나 심각한 데이터 및 / 또는 번호 크 런칭이 필요한 경우 rasPi가 올바른 선택이 아닐 수 있습니다.


1

저전력 CPU를 파이에 남겨두고 수십 개의 파이에서 CPU로 데이터를 얼마나 빨리 가져 와서 노력의 가치를 얻을 수 있는지 알 수 없습니다. 버스 속도는 CPU 속도만큼 클러스터 된 슈퍼 컴퓨팅에서 중요합니다. 파이는 여기에서 매우 부적절합니다.

네트워킹과 디스크 액세스 모두 동일한 60MB의 USB2 버스를 공유합니다. SD 카드는 20MB 속도 범위에서 최상의 성능을 발휘합니다.

150MB의 SATA 및 2GB PCI 버스의 이더넷을 갖춘 저사양 PC 하드웨어는 훨씬 더 많은 대역폭을 제공합니다.


3
이는 전적으로 응용 프로그램에 따라 다릅니다. 일부 응용 프로그램은 "작업"대 "통신"비율이 매우 높고 다른 응용 프로그램은 수행 한 작업량 당 훨씬 더 많은 통신이 필요합니다.
Chris Stratton

0

노드 간 슈퍼 컴퓨팅을 배우고 자하는 경우 .. 나는 파이를 설정합니다. 저렴하지만 강력한 무언가를 원하신다면 중고 Xenon 기반 멀티 코어 Intel 서버 / 워크 스테이션을 구입하고 하나 이상의 Tesla 카드 또는 Cuda GPU 카드 또는 Intel Phi 카드를 사용하십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.