2 서버 HA 클러스터에서 이상한 동작을 발견했으며 누군가 내 의심을 확인하거나 다른 설명을 제공 할 수 있기를 바랐습니다 ... 여기 내 설정이 있습니다.
- 2 서버 SQL 2012 SP1 설치
- 일부 데이터베이스에 대해 SQL AlwaysOn HA가 활성화되었습니다.
- CPU는 2.4GHz, 4 코어
- RAM은 34GB입니다 (AWS 인스턴스이므로 홀수).
- 리소스 사용률이 상대적으로 낮습니다. 각 서버에 14GB 이상의 메모리 여유 공간이 있으며 사용할 메모리 용량이 SQL에 제한되어 있지 않습니다.
- 디스크 액세스 시간은 괜찮습니다-거의 15ms / 읽기 또는 쓰기 이상
- 데이터베이스가 크지 않음-1GB, 1.5GB, 7.5GB
- SQL Server 프로세스가 16GB 개인 바이트, 15GB 작업 세트를 사용하고 있습니다.
전반적으로 리소스 문제는 언급되지 않았습니다. 이제 이상한 부분입니다. SQL이 다시 시작되지는 않지만 (프로세스가 거의 6 개월 동안 실행 중임) ~ 50 일마다 페이지 수명 예상 카운터가 거의 0으로 떨어집니다.이 시점까지 꾸준히 올라가면 하락은 없습니다. 성능 그래프는 다음과 같습니다.
카운터 데이터를 볼 때 (정확한 숫자가 없으며 시간당 집계 만 있음) PLE 카운터 값이 매번 (적어도 데이터가있을 때마다) 약 4,295,000 초 (대략 50 일)에 도달 한 것 같습니다.
내 미친 이론은 PLE 숫자가 부호없는 long int (4,294,967,295의 한계)로 밀리 초 단위로 유지되고 49.71 일에 디자인 또는 버그로 재설정됩니다. 이것은 두 서버의 동작과 동일한 패턴을 설명합니다. 또는 완전히 다른 것일 수 있으며 나는 이해가되지 않습니다. :)
누구든지 그런 것을 보았 거나이 행동을 설명 할 수 있습니까?
추신 : 나는 이 게시물을 보았지만 내 사건은 약간 다릅니다.
PPS 이것은 다시 게시 된 것입니다-원래 여기에 게시했지만 여기 에있는 청중이 더 적합하다는 것이 알려졌습니다.
감사!