LAN 내에서 TCP 재전송 원인 찾기


25

안녕하세요 수십 개의 서버 오류

약 100 대의 컴퓨터, 2 개의 Windows 도메인 서버 및 12 개의 VoIP 전화로 구성된 LAN에 자극적 인 문제가 있습니다. 약 1 년 전, 매주 정도 설치 한 이래로 VoIP 전화 자체가 재설정되는 경우가 있습니다. 동시에 컴퓨터에서 일시적으로 연결이 끊어지는 징후가 종종 있습니다. 네트워크 공유에 액세스하는 동안 탐색기가 멈추고 데이터베이스 서버에 대한 연결이 끊어져서 관리 소프트웨어에 오류가 발생합니다.

VoIP PBX와 나머지 네트워크 간의 연결에 대한 Wireshark 모니터링을 수행했습니다. Wireshark는 전화 재시작을 기록 할 때 재전송 된 TCP 패킷을 수집합니다. Wireshark 로그에는 하루에 약 2 개의 재전송 클러스터가 5 개에서 수백 개에 이릅니다. 각 클러스터의 클러스터는 주로 PBX와 일부 VoIP 전화 세트 사이에 있지만 항상 같은 세트는 아닙니다. 재전송은 종종 같은 스위치에 연결된 전화로 이루어 지지만, 때로는 네트워크의 반대쪽 끝에서 전화로 재전송되는 경우도 있습니다. 클라이언트 시스템과 파일 서버간에 TCP 트래픽을 전달할 때 일반적으로 일치하는 재전송이 있습니다.

재전송 및 전화 재설정의 급증은 네트워크가 많이로드 될 때와 관련이 없습니다. 낮에는 조금 더 발생하지만 트래픽이 감소해야하는 저녁에는 대부분 발생합니다. 대부분의 컴퓨터가 꺼져 있고 트래픽이 가장 적어야하는 늦은 밤에 자주 발생합니다.

이와 같은 문제의 원인을 진단하는 데 도움이되는 아이디어가 있습니까? 내가 아직 시도하지 않았지만해야 할 한 가지는 모든 스위치의 펌웨어를 업데이트하는 것입니다.


1
어떤 모델 스위치? 프로세서, 메모리 등 통계는 어떻게 보입니까? 하나의 브로드 캐스트 도메인에 있습니까? 네트워크에서 최대 처리량에 얼마나 가깝습니까?
Zypher

어떤 VoIP 프로토콜을 사용하고 있습니까? 또한 UDP 또는 TCP를 사용합니까?
Chris S

모든 스위치는 3Com : Baseline 2924-PWR Plus (3CBLSG24PWR) x 2, 4200 (3C17304A) x 3, 4200 (3C17304) x 2, 2824-SPF Plus (3C16487), 2250 plus (3C16476CS)입니다. 나는 그들이 프로세서 또는 메모리에 대한 통계를 제공한다고 생각하지 않지만, 다른 방법을 배우게되어 매우 기쁩니다. 예, 우리는 하나의 브로드 캐스트 도메인에 있습니다. 나는 처리량에 대해 모른다. 나는 그것을 측정 할 것이다.
초현실적 인

답변:


17

TCP 재전송은 일반적으로 네트워크 정체로 인해 발생합니다. 문제가 발생했을 때 많은 브로드 캐스트 패킷을 찾으십시오. 캡처에서 브로드 캐스트 트래픽의 백분율이 캡처 된 총 트래픽의 약 3 %를 초과하면 정체가 발생합니다. 네트워크에서 물리 계층 (ARP) 및 네트워크 계층 (이름 확인) 브로드 캐스트를 모두 찾으십시오. 대량의 브로드 캐스트 트래픽을 찾으면 캡처 데이터에서 소스로 트래픽을 추적 할 수 있습니다.


9
또한 TCP 재전송은 문제의 원인이 아니라 문제의 증상입니다.
joeqwerty

UDP 브로드 캐스트를 살펴본 결과 재전송과 관련이 없음을 언급 했어야합니다. 재전송 이벤트 중 일부는 UDP 브로드 캐스트의 급증과 일치하지만 대부분은 그렇지 않습니다. 나는 또 다른 모습을 보았고 UDP 브로드 캐스트는 10 분 시간 세그먼트에서 트래픽의 약 1.5 % (약 350 패킷)를 초과하지 않으며 그 수준에 도달하는 것은 드 that니다. 그러나 나는 이더넷 브로드 캐스트를 보지 않았다. 모든 wireshark 로그를 필터링하기 위해 스크립트를 지금 실행하고 있습니다. UDP 브로드 캐스트 및 이더넷 브로드 캐스트의 3 % 규칙이 개별적으로 또는 결합되어 있습니까?
초현실적 인

1
3 %는 실제로 경험의 법칙이 아닙니다. 그것은 내가 들었던 것과 내 환경에서 본 것입니다. 10 ~ 20 % 범위의 숫자를 들었지만 3 ~ 5 %를 초과하면 일반적으로 문제를 일으키는 것으로 나타났습니다. 이더넷, 네트워크 및 멀티 캐스트 브로드 캐스트는 모두 혼잡을 유발할 수 있으므로 모든 브로드 캐스트 트래픽을 확인해야합니다. 기본적으로 모든 스위치 포트로 브로드 캐스트되는 트래픽은 분석 및 축소 또는 제거해야하는 트래픽입니다.
joeqwerty

나는 오랜 기간 동안 좋은 상관 관계를 확인하기 위해 여전히 예쁜 그래프를 얻지 못했지만 이더넷 방송은 상당히 유망한 것으로 보입니다. 재전송이 발생한 로그 하나는 브로드 캐스트가 3 % 이상, 다른 하나는 약 6 %입니다. 적어도 하나의 문제를 발견했습니다. 오래된 서버가 일정한 ARP 패킷 스트림을 지속적으로 내보내고 있습니다.
초현실적 인

1
나는 와이어 샤크 필터의 사용 과도한 ARP 항목 발견 arp의 필터를 사용하여, 오직 방송 사람을 참조를 -eth.addr==ff:ff:ff:ff:ff:ff
mlhDev

2

스위치에 대한 트래픽 통계를 수집하면 용량이 거의 또는 거의 비슷한 기간이 표시 될 수 있습니다. 초기 시간 초과 (대개 3 초) 내에 응답이 다시 나타나지 않으면 재 시도가 발생할 수 있습니다. 이것은 혼잡 완화 메커니즘이 시작될 때까지 일시적으로 혼잡을 증가시킵니다.

스트리밍 미디어를 사용하는 사람들은 밴드와 함께 빠르게 흡수 될 수 있습니다.

트래픽 조절을 통해 전화 문제를 완화 할 수 있습니다. 이것은 단지 다른 사용자에게 문제를 옮길 것입니다.


2

스패닝 트리 루프 또는 브로드 캐스트 스톰과 같은 소리, 특히 재전송 및 문제가 동일한 스위치에 국한된 경우 (다른). 발생하면 L2 장치의 포트 상태는 무엇입니까? 아마도 스위치가 잘못되었거나 루트 브리지 우선 순위가 잘못 되었습니까? 재미있는 문제.


스패닝 트리에 대해 읽어 보라고 부탁해 주셔서 감사합니다. 그러나 네트워크에 중복 링크가 없기 때문에 스패닝 트리 루프가 될 수 있다고 생각하지 않습니다 (자체적으로 문제가 될 수 있음). "L2 장치의 포트 상태"는 스패닝 트리 알고리즘의 결과로 스위치가 활성화 한 포트를 의미합니까? 루트 브리지를 수동으로 구성하지 않았습니다. 그렇게하는 것이 좋습니다.
초현실적 인

STP에 익숙해지는 것은 좋은 생각이지만 중복 링크가없는 경우 STP는 문제가되지 않습니다.
joeqwerty

예, 중복 된 링크가 없다면 문제가되지 않습니다. 포트 상태에 따라 예, 앞으로 / 차단 / 학습 중입니다.
McJeff

2

시간이 오래 걸리기 때문에이 문제를 해결했을 수도 있지만 엔드 포인트 (Voip 전화, 워크 스테이션, 서버)가있는 포트에서 "포트 빠른"을 활성화해야합니다. 전화기는 PDU를 전송할 수 있으므로 해당 사용자가 재부팅하면 STP 수렴이 발생하여 FDB 테이블이 플러시되고 모든 장치가 4/5 단계 STP 재미를 거치게됩니다. 엔드 포인트가있는 포트를 "port fast"로 설정하면 대기를 건너 뛰고 전달 모드로 바로 이동합니다.


1

전화가 다른 컴퓨터와 다른 서브넷과 VLAN에 있기를 바랍니다.


그들은 동일한 IP 서브넷에 없으며 동일한 VLAN도 확신합니다. 이것이 심각한 문제입니까? 그것은 좋은 아이디어가 될 것 같습니다. 전화와 다른 모든 방송 도메인을 분리한다는 것을 알 수 있습니다. 다른 장점이 있습니까?
초현실적 인

예, 확실히 전화를 전용 VLAN에 두었습니다.
Greg Askew

1

결함이있는 스위치와 같은 결함이있는 장치 일 수도 있습니다. 재전송은 하나의 특정 스위치 나 네트워크의 일부에있는 전화 / 컴퓨터와 관련이 있습니까?

내 대답을 조금만 연장하십시오. 사양이 동일하더라도 모든 스위치가 동일하게 생성되는 것은 아닙니다. 일부는 프로세서가 더 빠르기 때문에 다른 것보다 훨씬 높은 부하에 대처할 수 있습니다. 스위치의 등급이 맞지 않을 수 있습니다.

가장 까다로운 VOIP 전화 중 일부를 자체 물리적 스위치에 넣고 그 재설정이 계속되는지 확인합니다. 그것이 사라지면 당신은 그것을 빨리 해결하기위한 길에 있습니다.


나는 그들이 원했다. 네트워크의 반대쪽 끝에있는 두 개의 스위치에 연결된 장치에는 대부분 문제가있는 것 같습니다. 그러나 네트워크의 다른 부분에서도 전화로 재전송이 많이 이루어집니다.
초현실적 인
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.