이 이벤트가 다시 발생하지 않도록 이벤트 후 조언을 찾고 있습니다.
VSS 이중화를 위해 구성된 2 개의 Cisco 4500x 스위치로 구성된 네트워크 코어가 있습니다. 여기에는 iSCSI 장치, vSphere 용 HP 블레이드 센터, 사용자 액세스 스위치에 대한 통합 링크 및 서버 룸에 구리 장치 용 4948e 스위치 쌍이 있습니다. 4948es에서 두 ISP 링크를위한 2960 스위치 쌍과 방화벽으로 ASA 쌍이 있습니다. 4948e에 연결하는 많은 장치가 단일 NIC 만 가지고 있다는 점을 제외하고는 상당히 중복성이 뛰어납니다.
현재 사용자 액세스 스위치 (이전 Extremes)를 Meraki로 교체 할 준비를하고 있습니다. 또한 현재 Aruba를 대체하기 위해 Meraki AP를 구현하고 있습니다. 무선 프로젝트에는 AP 관리 및 게스트 무선을위한 몇 가지 새로운 VLAN 및 서브넷을 만드는 것이 포함됩니다.
4500x에는 정의되지 않은 두 개의 VLAN (20 및 40)이 있었지만 서브넷은 비어 있고 포트를 사용하는 포트가 없는지 확인했습니다. 4500x로 이동하여 " no interface vlan 20
"를 발행 한 다음 서브넷으로 다시 빌드했습니다. 나는 원했다. 그런 다음 Meraki에 연결된 두 개의 10Gb 포트에 추가했습니다.
switchport trunk allowed <previous list plus two VLANs above plus existing wireless VLAN>
20 개와 40 개의 VLAN이 종료 된 것을 확인하여 발행 no shutdown
했습니다. 그 시점에서 Merakis에 대한 액세스 권한이 없어서 해당 링크의 포트 채널 인터페이스에 VLAN을 추가하지 않았다는 것을 깨달았습니다.
현재 환경의 절반에 도달 할 수 없습니다
우리의 인터넷 링크는 극도로 틀렸다. Avaya VoIP 전화가 전화를 걸거나받을 수 없습니다. 우리는 사용할 수 없게 된 구리로 연결된 iSCSI 장치 몇 개를 보유하고 있습니다. 사용자에게 문제가 발생하지 않았지만 백업 및 메일 아카이브가 영향을 받았습니다. 나는 서버 룸에 들어가서 어떻게 든 루프를 만들었을 때 4500x에서 Merakis를 분리했다 (두 10Gb 파이버 포트의 플러그를 뽑았다). 나는 그 시점에서 잠시 동안 이것을 쳐다 보는 것을 인정합니다.
Orion을 끌어 내고 외부 스위치 중 하나 (Cat2960)와 ASA 쌍 중 하나도 다운 된 것으로 나타났습니다. 우리는 일종의 부분 LAN 연결 손실이 있었지만 ASA 쌍은 서로 교차 연결되어 있으며 업 링크가 다운되지 않아 내부 장치가 도달 할 수있는 수준으로 장애 조치되지 않았습니다. "다운"ASA를 종료하고 인터넷에 다시 연결할 수있게되었습니다.
TAC에 전화를 걸었고 다운 된 각 호스트에 대해 모든 포트 구성을 계속 nitpicking 한 기술과 몇 시간 동안 씨름 한 후 4500x에서 그를 보여주었습니다 .4948e 스위치 중 하나에 로그인하여 어떻게 핑을 할 수 없는지 보여주었습니다. Windows 기반 구리 iSCSI 장치 중 하나, 블레이드 센터의 iLO 인터페이스 등 직접 연결되어 있습니다.
그는 로그를 살펴 보았지만 아무것도 찾지 못했습니다. 그러나이 시점에서 그는 "로그에서 볼 수없는 경우에도 스패닝 트리 버그처럼 보입니다"라고 말하면서 4948e와 그 모든 것을 직접 재부팅했습니다. Avaya 캐비닛을 포함하여 연결된 호스트가 바로 백업되었으므로 전화기가 다시 작동하기 시작했습니다. 4500x 파이버 연결 장치에는 여전히 문제가있었습니다. 모든 경로가 중복 되었기 때문에 데드 경로입니다. 그는 비정상적으로 전원을 껐다 켜고 싶었지만 여기에는 10Gbit iSCSI가 모두 포함되어 vSphere 환경 (기본적으로 모든 서버)의 상태가 좋지 않은 주가되었습니다. 나는 그에게 남은 문제를 처리하는 우아한 리던던시 전환을하도록 말했다.
TL; DR : 나는 우리의 핵심을 상당히 무해하게 바꾸었고, 끔찍한 문제를 일으켰습니다. VLAN을 종료하지 않고 포트 채널에 추가 한 다음 포트를 추가 한 경우이를 피할 수 있었을 것으로 예상되는 구성 실수가 있었습니까? 시스코 기술은 그렇게 말하지 않았다. 그는 1 년에 걸친 가동 시간과 구 IOS 버전으로 이와 같은 상황은 놀라운 일이 아니라고 말했다.
4500x : Cisco IOS 소프트웨어, IOS-XE 소프트웨어, Catalyst 4500 L3 스위치 소프트웨어 (cat4500e-UNIVERSALK9-M), 버전 03.04.05.SG RELEASE SOFTWARE (fc1) ROM : 15.0 (1r) SG10
4948e : Cisco IOS 소프트웨어, Catalyst 4500 L3 스위치 소프트웨어 (cat4500e-IPBASEK9-M), 버전 15.0 (2) SG10, RELEASE SOFTWARE (fc1) ROM : 12.2 (44r) SG11