Azure Batch, 우선 순위가 낮은 노드가 전혀 작동하지 않음


2

우리 회사에서 우선 순위가 낮은 노드를 오랫동안 사용해 왔습니다. 때때로 우리는 선점 노드를 얻지 만 우리의 작업은 결국 실행됩니다.

전용 노드가 1 개 있으며 우선 순위가 낮은 노드를 최대 20 개까지 확장 할 수 있습니다. 지난 3 일 동안 스케일링시 우선 순위가 낮은 노드가 작성되지 않았습니다. 스케일링은 더 많은 노드를 설정하려고 시도하지만 그대로 유지됩니다.

이에 대한 해결책이 있습니까? 우선 순위가 낮은 노드가 현재 끊어 졌습니까?

답변:


1

배치에 우선 순위가 낮은 VM 사용

우선 순위가 낮은 VM을 사용할 때의 단점은 사용 가능한 용량에 따라 해당 VM을 할당 할 수 없거나 선점 할 수 있다는 것입니다.

우선 순위가 낮은 인스턴스를 전혀 사용할 수 없을 것으로 예상하는 것은 비합리적입니다. 초과 용량이 무한정 존재하지 않을 수 있습니다.

먼저 상태 대시 보드 및 / 또는 소셜 미디어를 확인하십시오. 배치에 대해보고 된 문제가 표시되지 않습니다.

다른 지역에서 다른 인스턴스 크기를 구매하십시오. 때로는 좋아하는 크기의 잉여 부족이 지역적입니다.

완료해야하는 작업에 대한 전체 가격 인스턴스를 추가하십시오.


우선 순위가 낮은 노드는 하루 중 특정 시점에 사용 가능한 경향이 있습니다. 그들은 3 일 연속으로 절대 사용할 수 없습니다. 우리는 2 년 동안 그것들을 사용해 왔습니다. 문제는 일부 VM 개체 / 리소스가 삭제되어 우선 순위가 낮은 노드는 깨졌지만 전용 노드는 깨지지 않았다는 것입니다.
Renato Fontes

0

이 문제는 매우 복잡했으며 Azure Batch의 버그 일 수 있습니다.

팀의 누군가가 일부 VM 오브젝트를 자원 그룹에서 제거했습니다. 이로 인해 우선 순위가 낮은 VM을 시작할 수 없었습니다. 이상한 부분은 전용 VM이 실제로 올바르게 시작되었다는 것입니다.

VM 이미지를 사용하여 새 VM을 만든 다음 새 IMAGE를 사용하여이 문제를 해결하고이 새로운 이미지를 사용하여 Azure Batch 풀을 다시 만들었습니다. 중요한 부분은 VM 객체를 삭제하지 않았습니다.


배치에서 무언가를 알아 내려고 노력하고 있는지 알 수 있도록 한 가지 더 : 배치는 버그가 있습니다. 특히 Linux VM을 사용할 때. 우분투 1804는 적어도 몇 개월 전에 일괄 처리가 완전히 중단되었습니다 (1604를 사용하고 있습니다).
Renato Fontes
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.