내 Xen 서버는 iSCSI SAN 클러스터에 대한 open-iscsi가있는 openSUSE 11.1입니다. SAN 모듈은 이니시에이터가 연결하는 가상 IP 뒤의 IP 장애 조치 그룹에 있습니다.
기본 SAN 서버가 다운되면 보조 서버가 대상 역할을 수행합니다. 이것은 모두 LeftHand SAN / iQ 소프트웨어에 의해 처리되며 대부분의 상황에서 잘 작동합니다.
내가 가진 문제는 때때로 내 Xen DomU의 일부가 IP 장애 조치 후 루트 파일 시스템이 읽기 전용으로 이동한다는 것입니다. 일관성이 없으며 장애 조치가 발생할 때마다 다른 하위 집합에 발생합니다. 그들은 모두 동일한 openSUSE 11.1 소프트웨어 이미지를 실행하고 있습니다.
각 DomU의 루트 파일 시스템은 Dom0에서 open-iscsi로 마운트 된 다음 Xen은 표준 블록 장치 드라이버를 사용하여 DomU에 노출시킵니다.
정확한 증상은 루트 권한으로 touch /test
"읽기 전용 파일 시스템"오류를 반환한다는 것입니다. 그러나 출력은 mount
읽기-쓰기로 마운트 된 것으로 표시합니다. 물론, domU의 다른 모든 I / O도이 시점에서 실패하므로 시스템이 다운됩니다. xm
iSCSI 세션을 다시 연결하지 않고도 Dom0에서 다시 시작하기 만하면 모든 것이 다시 작동합니다.
Dom0 측에서 페일 오버 중 syslog 메시지는 다음과 같습니다.
kernel: connection1:0: iscsi: detected conn error (1011)
iscsid: Kernel reported iSCSI connection 1:0 error (1011) state (3)
iscsid: connection1:0 is operational after recovery (1 attempts)
이 문제를 디버깅 할 계층을 파악하는 데 어려움을 겪고 있습니다. DomU 커널에 있습니까? 또는 Dom0 또는 Xen 수준입니까? 어딘가에 시간 초과를 늘리기 위해 조정해야 할 매개 변수가 있다고 생각하지만 어디를 봐야할지 모르겠습니다.
연결된 블록 장치가 여전히 Dom0에서 읽고 쓸 수 있기 때문에 open-iscsi의 문제라고 생각하지 않습니다.