많은 I / O 워크로드에서 수많은 가상화 서비스 (Azure) 및 제품 (vmware, kvm, hyperv) I / O 및 시스템 중단이 발생했습니다.
내 질문은 :
- I / O 작업량이 많은 작업을 수행 할 때 가상화 된 솔루션을 사용하는 것이 제정신입니까?
- 이런 종류의 것들에 대한 모범 사례는 무엇입니까?
- 이러한 문제의 원인은 무엇입니까, 시스템 병목 현상이 잘 알려져 있습니까? 아니면 과도한 경합의 문제입니까?
많은 I / O 워크로드에서 수많은 가상화 서비스 (Azure) 및 제품 (vmware, kvm, hyperv) I / O 및 시스템 중단이 발생했습니다.
내 질문은 :
답변:
I / O 작업량이 많은 작업을 수행 할 때 가상화 된 솔루션을 사용하는 것이 제정신입니까?
그렇습니다. 실제로 제정신입니다. 사실 대부분의 조직에서는 사실상 가상이 기본이며 물리적 상자에 대한 작업은 예외입니다. 우리는 모든 형태의 100k 개 이상의 VM을 보유하고 있으며 그 중 많은 수가 전혀 문제가없는> 40k IOPS입니다.
이런 종류의 것들에 대한 모범 사례는 무엇입니까?
여기서 중요한 것은 가상화 여부와 관계없이 IO의 요구 사항을 잘 이해하고 가상 스토리지 리소스를 일치시키는 것입니다. 스토리지 시스템과 비교하여 필요한 / 원하는 것을 알고 예산을 책정 한 경우 가상화 계층은 실제로 거의 또는 전혀 영향을 미치지 않습니다. 수억 개의 IOP).
이러한 문제의 원인은 무엇입니까, 시스템 병목 현상이 잘 알려져 있습니까? 아니면 과도한 경합의 문제입니까?
스토리지 리소스가 너무 적어서 이해하지 못하거나 너무 많은 노력을 기울이지 않으면 사람들의 문제가 발생합니다.
I / O 작업량이 많은 작업을 수행 할 때 가상화 된 솔루션을 사용하는 것이 제정신입니까?
데이터베이스 서버가 1gb / 초의 임의 IO 수를 정기적으로 가져 옵니까? 여기 하나주세요
또는 HPC 클러스터에 최대 600mb / 초를 제공하는 가상 파일 서버. 그 중 하나는 Raid 10에서 8 대의 Velicoraptor를 사용하고 있습니다.
이런 종류의 것들에 대한 모범 사례는 무엇입니까?
충분한 IO를 제공하십시오. 이 SQL VM에는 약 8 또는 10 개의 전용 SSD가 있다고 생각합니다.
이러한 문제를 일으키는 원인은 잘 알려진 시스템 병목 현상입니다.
기본 수학을하지 않는 사람들. IO 서브 시스템이로드를 처리 할 수없는 경우 가상화에서도 수행되지 않습니다. 많은 IO가 필요하며 적절한 크기의 전용 스토리지 서브 시스템을 제공하십시오.
가상화되지 않은 것과 동일한 IO가 여전히 필요하다는 기본 수학 및 개념 외에도 QOS / 우선 염도 있습니다. 대부분의 가상화 플랫폼은이를위한 최소한의 기본 지원을 제공하며, 잘못 작동하는 개발자 VM이 사용자 DB를 정지시키는 것을 방지하는 데 도움이됩니다.