SQL Server에서 대규모 업그레이드 를 수행 할 준비가되었으며 앞으로 나아 가기 전에 해결하려는 Distributed Availability Groups의 비정상적인 동작에 주목하고 있습니다.
지난 달에 원격 보조 서버를 SQL Server 2016에서 SQL Server 2017로 업그레이드했습니다.이 서버는 여러 DAG (Distributed Availability Group) 와 별도의 AG (가용성 그룹)의 일부 입니다. 이 서버를 업그레이드 할 때 서버가 읽을 수없는 상태 가 될 것이라는 것을 알지 못했기 때문에 지난 한 달 동안 주 서버에만 의존했습니다.
다가오는 업그레이드의 일환으로 CU 4 패치를 서버에 적용하고 재부팅했습니다. 서버가 온라인 상태로 돌아 왔을 때 방금 패치 된 보조 서버는 모든 DAG / AG가 문제없이 동기화되고 있음을 보여주었습니다.
그러나 기본은 매우 다른 이야기를 보여주었습니다. 보고했다
- 별도의 AG가 문제없이 동기화되었습니다
- 그러나 DAG가 동기화되지 않음 / 건강하지 않음 상태에 있었습니다.
처음에 당황한 후 DAG에서 다시 동기화하기 위해 다음 사항을 시도했습니다.
- 기본에서 데이터 이동을 중단했다가 다시 시작했습니다. 데이터 동기화가 시작되지 않았습니다.
- 보조 (방금 패치 한 것)에서
ALTER DATABASE [<database] SET HADR RESUME;
오류없이 실행되었지만 동기화를 다시 시작하지 않았습니다.
데이터를 다시 동기화하려는 마지막 시도는 보조 서버에 로그인하고 SQL Server 서비스를 수동으로 다시 시작하는 것입니다. 서버를 재부팅하면 충분할 것으로 예상되므로 수동으로 서비스를 다시 시작하는 것은 약간 극단적 인 것처럼 보입니다.
재부팅 후에 DAG가 보조 서버와 동기화를 시작하지 않는 사람이이 문제에 부딪 쳤습니까? 그렇다면 어떻게 해결 되었습니까?
SQL Server 오류 로그와 보조 서버의 이벤트 뷰어를 모두 확인했는데 평소에 아무것도 볼 수 없었습니다.