HyperV VM의 연결이 임의로 끊어지는 이유는 무엇입니까?


10

약 2 주에 한 번씩 이상한 간헐적 연결 문제가 발생합니다.

먼저 내 구성 : 두 개의 물리적 호스트 (node01 및 node02)로 HyperV 장애 조치 클러스터를 실행 중입니다. 호스트는 모두 SP1이 설치된 Windows Server 2008 R2 HyperV 서버 (무료 서버)를 실행하고 있습니다. 이러한 호스트에서 각각 SP1이 포함 된 Windows Server 2008 R2 웹 버전을 실행하는 두 개의 VM을 실행하고 있습니다. 내 스토리지 서버는 iSCSI를 통해 연결된 Windows Storage Server 2008입니다. 스토리지 서버뿐만 아니라 호스트 모두 인텔 웹 사이트에서 직접 다운로드 한 최신 네트워크 드라이버를 실행하고 있습니다.

문제가 있습니다 : 99.99 %의 시간, 모든 것이 완벽하게 작동합니다. 약 2 ~ 3 주마다 한 번씩 VM의 수신 및 발신 네트워크 연결이 동시에 끊어집니다. 이런 일이 발생하면

  1. 어느 VM에도 RDP를 사용할 수 없습니다.
  2. 어느 호스트 에나 RDP를 사용할 수 있습니다.
  3. 노드를 마우스 오른쪽 단추로 클릭하고 '가상 머신에 연결'을 선택하여 장애 조치 클러스터 관리자에서 VM에 연결할 수 있습니다.
  4. 위의 # 3에 설명 된대로 VM에 연결하면 LAN의 웹 사이트 나 컴퓨터에 접속할 수 없습니다. VM 내부에서 가상 네트워크 연결을 비활성화했다가 다시 활성화해도 문제가 해결되지 않습니다.
  5. VM을 다른 노드로 옮기면 문제가 해결됩니다 (다음 2 주 동안).
  6. 호스트를 재부팅하고 VM을 다시 호스트로 이동하면 문제가 해결됩니다 (다음 2 주 동안).
  7. 이 경우 장애 조치 클러스터는 VM을 자동으로 장애 조치하지 않습니다.
  8. 호스트 또는 VM에 비정상적인 이벤트 로그 항목이 없습니다.

이것은 위에서 설명한 것과 동일한 증상으로 약 5 번 발생했습니다. 네트워크 드라이버 또는 네트워크 하드웨어 문제가 의심되지만 이미 최신 드라이버를 실행 중이므로 어떻게해야할지 모르겠습니다.

이것은 진정한 헤드 스크래퍼입니다 ... 어떤 아이디어?

최신 정보

매우 유사한 경우를 여기에서 발견했습니다. Virutal Machine이 Hyper V Cluster에서 네트워크 연결을 잃습니다.

2011 년 7 월 29 일 업데이트

핫픽스를 설치하고 네트워크 드라이버를 업데이트 한 후에도 여전히 같은 문제가 발생합니다. 하드웨어 세부 정보를 요구하는 의견에 따라 서버는 2 개의 독립 S5500HV 마더 보드를 포함하는 1U 섀시 인 Intel SR1670HV입니다. 통신은 인텔 82574L 인 마더 보드의 내장형 NIC를 통해 이루어집니다. 네트워크 드라이버 버전은 16.2.49.0입니다.


하드웨어 (nic 수)에 대한 detials를 추가 할 수 있습니까
Jim B

서버에 어떤 브랜드 / 모델의 NIC가 있습니까?
Chris S

위에 추가 된 하드웨어 및 NIC에 대한 정보.
Mike

어떤 브랜드 / 모델 스위치를 통해 연결하고 있습니까?
ErnieTheGeek

MS hyperV 서버의 CentOS 이미지와 비슷한 문제가있었습니다. 각 시스템 또는 공유 NIC에 전용 NIC가 있습니까? 일단 우리가 전용 nics로 전환하면이 문제는 사라졌습니다 ... 비록 진정한 해결책은 아닙니다 ...
n8whnp

답변:


7

우리는 내가있는 곳에 이런 문제가있었습니다. 정확한 세부 정보는 기억 나지 않지만 최종 솔루션은 가상 네트워크 어댑터에 동적으로 할당 된 충돌하는 Mac 주소와 관련이 있습니다. 그것들을 동적으로 고정시키는 것은 많은 도움이되지 않았습니다. 일반적으로 가상 머신을 다른 호스트로 옮기기가 더 어려워 질 수 있기 때문에 원하지는 않지만이 경우에는 도움이되었습니다.

다른 부분은 실제 nics가 broadcom에 의해 만들어졌으며 또한 구성 오류가 있었기 때문에 이전 관리자가 Broadcom 유틸리티를 잘못 사용하여 호스트에서 두 nic을 함께 트렁크에 연결하여 대역폭 / 처리량을 향상시키려는 시도가 잘못되었다는 것입니다. 해당 설정을 제거하고 nic 중 하나를 구성하여 호스트 시스템에 IP가 전혀 없었지만 여전히 가상 게스트로의 통과에 사용될 수있었습니다. 그런 다음 각 가상 머신은 하나의 NIC 만 사용하도록 설정하고 히스토리 트래픽에 따라로드 밸런스를 조정합니다. 물론 이는 어댑터 나 연결이 끊어지면 페일 오버가 발생하지 않으며 시간이 지남에 따라 트래픽의 균형이 유지되는지 확인하지 못했지만 그 이후로는 안정적으로 유지되었습니다.


5

나는 이것이 오래된 질문이라는 것을 알고 있지만 같은 문제가 발생하여 해결하는 데 너무 많은 시간을 낭비하여 나를 위해 일한 솔루션을 공유 할 것이라고 생각했습니다. 내 문제에 대한 해결책을 여기서 찾았습니다.

http://invendows.wordpress.com/2008/03/06/network-issue-with-hyper-v/

내 상황의 해결책은 VM에서 TCP 오프로드를 비활성화하는 것이 었습니다. 링크에서 관련 섹션을 인용하겠습니다.

TCP 오프 로딩을 비활성화하려면 Broadcom 8507 Nextreme II NIC에 연결된 각 VM에서 새 레지스트리 값을 만들고 설정해야했습니다.

다음 레지스트리 변경을 사용하여 TCP 오프 로딩을 비활성화했습니다.

키 : HKLM \ SYSTEM \ CurrentControlSet \ Services \ Tcpip \ Parameters

값 (DWORD) : DisableTaskOffload = 1

이 방법으로 각 VM에서 TCP 오프로드를 비활성화 한 후 모든 문제가 해결되었으며 Broadcom 5708 Nextreme II NIC의 NIC 포트 하나에 여러 VM을 연결할 수있었습니다.

내 서버에는 Broadcom NetExtremeNIC 가 있으므로이 문제의 원인은 드라이버와 관련이 있지만 DisableTaskOffload= 1로 설정 하면 문제가 완전히 해결되었습니다. 이 정보가 다른 사람의 검색 시간을 절약 해주기를 바랍니다.


1
+1,이 팁 덕분에 아무런 문제없이 며칠 동안 뛰었습니다.
m0dest0

1
문제 없습니다, m0dest0. 도움이되었다 니 다행입니다. :)
BruceHill

3

훨씬 간단한 Hyper-V 환경에서 비슷한 문제가 발생하여 Microsoft의이 기사를 살펴 보았습니다. 웹 서버를 많이 사용하는 경우 상황에 맞는 것 같습니다.

http://support.microsoft.com/kb/974909-Windows Server 2008 R2 기반 컴퓨터에서 나가는 네트워크 트래픽이 많으면 실행중인 Hyper-V 가상 컴퓨터의 네트워크 연결이 끊어집니다


참고로 언급 한 KB 기사는 SP1 이전의 기사이지만 SP1 이후에도 유망한 것으로 보입니다. support.microsoft.com/kb/2263829
Mike

1
핫픽스를 설치했기 때문에이 답변을 제거했지만 문제가 계속 발생합니다. 따라서,이 질문에 대한 답은 여전히 ​​남아 있습니다.
Mike

2

우리의 경우에는 24-48 시간마다 똑같은 문제가있었습니다. 안티 바이러스 / 방화벽 제품이 Hyper-V가 포함 된 Server 2008을 제대로 지원하는지 다시 확인하고, 그렇지 않은 경우 안티 바이러스 / 방화벽 제품을 다른 방법으로 시도해보십시오 (또는 가능한 경우 일시적으로 제거). .

나중에 Microsoft에 전화를 걸어 여러 덤프 / 로그 파일을 업로드 한 후에 TrendMicro OfficeScan이이 경우의 원인이라고 판단했습니다. 우리는 Hyper-V에서 명시 적으로 지원되지 않는 것으로 판명되었습니다. 최신 릴리스로 업그레이드하면 문제가 해결되었습니다.


2

이것은 하드웨어 문제로 판명되었습니다 .Netgear GSM7224v2 매니지드 스위치로 문제를 분리하여 D-Link DGS-1024D로 교체했으며 그 이후로 모든 것이 잘 작동했습니다.

이 경우 "학습자"로서 하드웨어 문제로 판명 된 소프트웨어 설정 문제를 진단하는 데 99 %의 진단 노력을 기울였습니다. 나는 심지어 소프트웨어 설정에서 돈을 벌어 알아내는 데 도움을주기 위해 Microsoft 지원에 259 달러를 지불했으며 많은 시간을 함께 보냈다. 이야기의 교훈은 소프트웨어만큼이나 하드웨어를 의심하는 것입니다.


1

VM 게스트의 네트워크 어댑터 속성에서 점보 패킷 및 대용량 전송 오프로드를 비활성화 했습니까? 이 설정에 대한 나의 경험을 바탕으로, 나는 그것을 시도 할 것입니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.