Cisco 스위치 포트가 불량입니까?


9

지난 며칠 동안 내부 네트워크에있는 소수의 최종 사용자에 대한 패킷 손실 및 네트워크 안정성 문제를 겪고 있습니다. 이러한 문제는 지난 주에 나타 났지만 6 주 전에 번개쳤습니다 .

77 미터 길이의 다른쪽에있는 4 대의 Cisco 2960과 여러 PC 및 전화기의 스택간에 5-10 %의 패킷 손실이 발생했습니다. PC는 트렁크 링크 ( 스위치 포트 구성 pastebin )를 통해 전화기와 인라인으로 실행되었습니다 . 클라이언트-서버 응용 프로그램 및 Microsoft Exchange 연결에서 호출이 끊어지고 중단되었습니다.

일반적인 문제 해결 단계를 원격으로 시도하여 사용자 및 프로덕션 활동이 중단되는 동안 현지 기술자가 다음을 수행하도록했습니다.

  • 벽면 잭과 장치간에 케이블을 교체하십시오.
  • 패치 패널과 스위치 포트 사이에 패치 케이블을 교체하십시오.
  • 2960 스택 내에서 다른 스위치 포트를 사용해보십시오.
  • 잘 알려진 장비 (새 전화, 다른 PC)로 최종 사용자 장치를 변경합니다.
  • 스위치 포트 인터페이스 카운터를 지우고 증분 오류를 면밀히 모니터링하십시오. (의 Pastebin 출력sh int )
  • 장치 로그 및 Observium RRD 그래프 위에 표시 됩니다 . 스위치 측에서 링크 업 / 다운 문제가 없습니다.
  • 최종 사용자 측의 전원 스트립을 교체하십시오.
  • 테스트 케이블은 test cable-diagnostics tdr int Gi4/0/9(깨끗한) *를 사용하여 Cisco 2960에서 실행됩니다.
  • 테스트 케이블은 Tripp-Lite 케이블 테스터와 함께 작동합니다. (깨끗한)
  • 스위치 스택 멤버에서 진단을 실행하십시오. (깨끗한)

결국 안정적인 솔루션을 찾기 위해 스위치 포트를 3 번 ​​변경했습니다. 유일한 논리적 결론은 일부 Cisco 2960 스위치 포트가 잘못되었거나 비정상적이라는 것입니다 ... 죽지 않았지만 동작이 일관성이 없습니다. 나는 이런 식으로 개별 포트가 죽는 것을 보는 데 익숙하지 않습니다.

이러한 장치가 나쁜지 테스트하거나 확인할 수있는 것은 무엇입니까?

이를 확인하는 가장 좋은 방법은 무엇입니까?

연속적인 포트 뱅크가 아닌 단일 포트에 문제가있는 것이 일반적입니까?


BTW- show cable-diagnostics tdr int Gi4/0/14매우 시원합니다 ...

Interface Speed Local pair Pair length        Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14  1000M Pair A     79   +/- 0  meters Pair B      Normal              
                Pair B     75   +/- 0  meters Pair A      Normal              
                Pair C     77   +/- 0  meters Pair D      Normal              
                Pair D     79   +/- 0  meters Pair C      Normal              

"show interface gi4 / 0 / 9"를 추가 할 수 있습니까? 또한 tdr 출력은 gi4 / 0 / 14에서 나옵니다. 몇 개의 포트에 문제가 있습니까?
Mike Pennington

@MikePennington 48 개 중 4 개의 인터페이스에 문제가있었습니다. 카운터가 지워졌습니다. 그러나 증가하고있는 유일한 카운터는 다음과 같습니다.Total output drops: 1461
ewwhite

총 출력 패킷 수에서 1461이 감소합니까? 4 개의 문제 포트 모두에 출력 강하가 표시됩니까?
Mike Pennington

@MikePennington 문제가 발생한 포트 2 개에 대한 인터페이스 pastebin 출력 .
ewwhite

1
기술적 인 답변은 아니지만 TAC 계약이 활성화되어 있습니까? 그렇다면, 참여하십시오 : P
ItsGC

답변:


7

포트 뱅크는 종종 ASIC을 공유하지만 각각 고유 한 PHY를 가져야합니다. PHY가 손상된 경우 주변 장치와 달리 PHY가 문제가 될 수 있습니다.

즉, 출력 저하는 물리적 문제에 대한 이상한 증상입니다. 불가능하지는 않지만 일반적이지 않습니다. 반이중 링크에도 불구하고 출력 손실은 일반적으로 물리적 문제보다 버퍼 소진과 더 관련이 있습니다.

전선의 다른 쪽에서 패킷 캡처를 설정하여 자세한 정보를 얻을 수 있습니다. 잘못된 PHY는 링크의 한쪽 또는 양쪽에 몇 개의 물리적 계층 오류 (잘못된 CRC, 런트 / 거대한 등)와 함께 나타날 것으로 예상됩니다.

대체로 수익이 감소하는 시점을 지나갈 수있을 정도로 충분히 제거 된 것처럼 들립니다. 계약이있는 경우 RMA를 권장합니다.


이것은 여러 스위치의 여러 포트에서 발생하지만 작은 사용자 하위 집합에서만 발생하므로 네 개의 스위치를 모두 교체 해야하는 경우입니까? 교체에 상당한 가동 중지 시간, 교체 작업 등이 필요하기 때문에 핵심 문제를 모른 채 교체를 위해 로비에
어려움을 겪고 있습니다

번개는 매우 이상한 동물이며 그로 인한 손상은 훨씬 나중에 예측할 수없는 방식으로 나타날 수 있습니다. 물론 가동 중지 시간은 빨라지지만 교체 스위치를 반복하고 패치를 옮긴 다음 기존 패치를 꺼내면 다소 개선 될 수 있습니다. 더 쉬운 답변이 있었으면 좋겠지 만 몇 가지 포트로 문제를 격리하면 할 일이 많지 않습니다.
rnxrx

PHY는 요즘 거의 항상 ASIC에 통합되어 있습니다. 더 저렴합니다. 마그네틱은 ASIC에 실제로 통합 할 수없는 유일한 부분으로, 손상 될 수 있지만 PHY는 아닙니다. 또한 Quad set magnetics를 사용하는 것이 일반적이므로 문제가 4 개의 포트에있는 경우이 이론에 적합합니다.
Chris S

실제로는 아닙니다. 문제의 스위치를 포함하여 대부분의 Cisco 스위치 아키텍처를 살펴보면 동일한 ASIC이 종종 하나 또는 두 개의 파이버 또는 구리 GE 또는 일부 100TX 그룹에 사용됩니다. 스위치 온 칩 아키텍처에서는 훨씬 더 많은 기능이 ASIC으로 옮겨 지지만 플러그 가능한 광학 장치 나 구리 미디어에 의해 여전히 물리적 계층이 처리되고 있습니다. 동일한 ASIC 컴플렉스가 종종 여러 가지 속도 및 전력 요구 사항을 처리 할 수 ​​있다는 점을 감안할 때이 기능을 동일한 스핀에 통합하는 것은 의미가 없습니다.
rnxrx

너무 많은 포트가 사용할 수없는 수준으로 저하 된 후 마지막으로 모든 스위치를 교체했습니다. 마지막으로 SmartNet을 잘 활용하십시오!
ewwhite

2

그렇습니다. 단일 포트는 나쁠 수 있지만, 기억 하듯이 전체 모듈을 교체해야합니다. (주의 사항 : 중요한 Cisco 작업을 수행한지 오랜 시간이 지났습니다 ...)

도움이 될지 확실하지 않지만 Etsy의 Ops 엔지니어 중 한 명인 Laurie Denness가 FITB를 확인하십시오 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.