Condor, OGE 및 Torque는 모두 당신을 데려 갈 수 있지만 Condor는 DAGMan 도구로 내장 된 종속성 관리 기능을 가지고 있습니다 . DAGMan을 사용하면 작업 흐름을 설명 하는 지시 된 비순환 그래프 를 설정할 수 있으며 관리자는 작업 흐름의 작업을 이동하고 흐름의 각 단계에서 합격 / 불합격 결과를 평가합니다. Condor는 상대적으로 플랫폼에 구애받지 않으므로 DAGMan도 마찬가지이므로 부모가 Linux 또는 Windows에서 실행될 때 AIX에서 하나의 자식 단계를 실행할 수 있습니다. DAGMan은 작업이 실행되는 위치와 관련이 없으며 종료 코드가 통과 또는 실패 만합니다.
소프트웨어 선택에 대한 팁이나 오픈 소스 또는 상업용 중 어떤 것이 더 좋은지 여부
몇 가지주의 사항이 있지만이 공간의 무료 커뮤니티가 가치가 있다고 생각합니다.
OGE는 지금 이상한 공간에 있습니다. 더 이상 Oracle에서 생산 한 GE 변형을 실행하는 것이 자유롭지 않으며 Oracle은 더 이상 GE SCC에 기록하는 코드를 제공하지 않지만, 무료 오픈 소스 프로젝트로 병역하려는 여러 가지 포크가 있습니다. 특히 Univa는 전직 Sun GE 개발자들이 오픈 소스, 무료로 이용할 수있는 GE 변형을 지속적으로 개발하기 위해 채용을 주도하고 있습니다. 그리드 엔진에는 두 가지가 있습니다. 설정이 쉽고, 2 분 미만의 짧은 작업을 처리 할 수있어 처리 속도를 늦추는 작업에 많은 스케줄링 오버 헤드를주지 않아도됩니다. 큰 단점은 Windows에 대한 지원이 잘되지 않는다는 것입니다. 우리 중 일부는 몇 년 전에 Cygwin에서 실행되도록 포팅하는 데 약간의 노력을 기울 였지만 확실히 네이티브만큼 좋지는 않습니다.
이제 Condor는 내가 언급 한 세 가지 기술 중 가장 좋아하는 것입니다. Condor 주변에는 강력한 커뮤니티가 있으며 소프트웨어는 매우 성숙합니다 (> 20 세 이상). 기본 Windows 및 POSIX OS 지원은 모든 곳에서 잘 실행됩니다. 앞에서 언급 한 DAGMan은 Condor와 함께 제공되는 많은 훌륭한 제품 중 하나 일뿐입니다. 설정하기가 복잡한 터치 일 수 있지만 일단 설정되어 실행되면 견고합니다. 작업 <-> 기계 일치를 수행하고 자원에 대한 사용 규칙을 작성하는 데 매우 유연한 언어가 있습니다. 또한 머신에 대한 동적 프로비저닝을 지원하여 작업에 필요한 머신 리소스 양을 선택한 다음 여전히 사용 가능한 차이를 다시 알릴 수 있습니다. 글로벌 리소스 카운터를 지원하므로 소프트웨어 라이센스와 같은 것을 제한 할 수 있습니다. 그리고 물론 워크 플로우 관리를위한 매우 강력한 도구 인 DAGMan이 있습니다. Condor의 단점은 단기 실행 작업에 대한 스케줄링 오버 헤드가 부담이 될 수 있다는 것입니다. 이상적으로 2 분 이상 실행되는 작업이 필요합니다. 그렇지 않으면 시스템에서 작업 시간이 작업 시간의 큰 부분이됩니다.
토크는 조금 더 틈새 시장입니다. 나는 그것에 대해 덜 알고 있습니다. Condor보다 Grid Engine과 비교됩니다. @warren이 언급 한 유료 애드온이 있으며 기본 무료 토크가 할 수있는 것을 확장 할 수 있습니다.
세 가지 기술을 시험해보고 특정 워크로드에서 어떻게 작동하는지 보려면 CycleCloud 를 통해 Condor, GridEngine 또는 Torque로 사전 구성된 안전하고 가상화 된 풀을 가동 할 수 있습니다. 당신의 부분에. 각 기술의 작은 풀을 가동시키고 대표적인 워크로드로 시험해 보는 것은 몇 달러가 될 것입니다. (면책 조항 : Cycle Computing에서 일하고 CycleCloud를 만듭니다)