ESXi에서 디스크 오류가 발생했는지 어떻게 알 수 있습니까?이 오류의 의미는 무엇입니까?


10

VMware ESXi v4.1.0 348481을 실행하는 서버가 있습니다. 하드웨어 RAID10 및 SATA 백업 드라이브가 있습니다. RAID10 데이터 저장소에 기본 부팅 vmdk이고 SATA 백업 드라이브의 데이터 저장소에 600GB vmdk 인 VM이 실행 중입니다. VM은 FreeBSD 커널과 함께 데비안 리눅스를 실행하고 백업 드라이브에 ZFS를 사용합니다.

편집 : 드라이브가 VM에 직접 연결되어 있지 않습니다 . VMware 데이터 저장소로 사용되며 VM의 SATA 드라이브 데이터 저장소에 vmdk가 있습니다. 데이터 스토어가 가득 차지 않았습니다 (65 % 만 가득 참)

SSH를 사용하여 서버에 로그인했는데 지난 밤 백업이 중단 zfs list되었거나 zpool list둘 다 중단 된 것을 발견했습니다 . 그래서 나는 ESXi에서 가상 콘솔을 열었고 슬 :습니다.

이 스크린 샷은 나를 슬프게합니다

(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)

VM을 재부팅하려고했는데 시스템이 재부팅을 위해 다운되었다는 메시지가 나타났습니다. (^ C가 나타나지만 죽이지 않습니다 shutdown). 나는 인터럽트 또는 수 없습니다 또는 내가하려고 할 때 아무 일도 발생 - 프로세스.kill -9zpool list zfs listrsync

  1. 이것은 백업 SATA 드라이브가 실패했음을 나타 냅니까? 아니면 이것이 ESXi 오류 일 수 있습니까?
  2. 드라이브가 고장인지 vSphere 클라이언트에서 어떻게 알 수 있습니까? 표시가 나타나지 않고 Hardware Health Status (하드웨어 상태) 아래의 모든 항목이 양호 해 보이며 Storage (스토리지) 구성에서 아무것도 보지 못했습니다.
  3. 여기서 어떻게 진행해야합니까? VM을 하드 재부팅해야합니까?

업데이트 : 방금 VM을 재부팅했습니다. 온라인으로 돌아온 후 백업 zpool은 온라인 상태였습니다.

root@timestandstill:/home/jnet# zpool status -v
  pool: backup
 state: ONLINE
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://www.sun.com/msg/ZFS-8000-8A
 scrub: none requested
config:

        NAME        STATE     READ WRITE CKSUM
        backup      ONLINE       0     0     0
          da1       ONLINE       0     0     0


errors: Permanent errors have been detected in the following files:

        /backups/someserver/home/someuser/public_html/somedir/calendar/someuser/calendars/somefile.ics

드라이브 교체에 크게 기울고 있습니다 ...

답변:


5

이러한 오류는 실제로 SATA 드라이브 중 하나에 블록 재 할당 공간이 부족할 정도로 불량 블록이 발생했음을 나타냅니다. 해당 드라이브가 잘못되어 교체해야합니다. vSphere 클라이언트에서 정보가 어디에 표시되는지 잘 모르겠지만 로그 항목이 명확합니다.

하드웨어가 허용하는 경우 핫 스왑이 가능해야합니다. 그렇지 않으면 변경을 수행하기 위해 모든 것을 종료해야합니다. 해당 VM이 30 분 후에 자체 종료되지 않은 경우 하드 종료해야합니다. 위험하지만 실제로 걸려 있으면 그다지 많지 않습니다.


감사합니다 @ sysadmin1138. 따라서 이러한 오류가 VM 내부에 표시 되더라도 실제 하드웨어 문제를 나타내는 것입니까? IE 그것은 단지 VMware 기발한 것이 아닙니다?
Josh

@Josh SATA 드라이브를 VM에 직접 표시했다면 분명히 알 수 있습니다. 파일 백업 스토리지의 경우 확실하지 않습니다. 데이터 스토어에 공간이 부족했을 수 있습니다.
sysadmin1138

나는 그것을 분명히 했어야했다. 파일 백업 스토리지입니다. 데이터 스토어에는 충분한 공간이 있습니다. 1TB 드라이브이고 VMDK는 600GB이며 디스크에는 아무것도 없습니다. 어느 쪽이든, 그것은 분명히 잘못된 것이므로 다른 누군가가 이것이 무엇인지에 대한 명확한 설명을 제공하지 않으면 드라이브를 교체 할 것입니다.
Josh
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.