NexentaStor 스토리지 장치로 실행 되는 HP ProLiant DL380 G7 서버가 있습니다. 이 서버에는 36GB RAM, 2 개의 LSI 9211-8i SAS 컨트롤러 (SAS 확장기 없음), 2 개의 SAS 시스템 드라이브, 12 개의 SAS 데이터 드라이브, 핫 스페어 디스크, Intel X25-M L2ARC 캐시 및 DDRdrive PCI ZIL 가속기가 있습니다. 이 시스템은 여러 VMWare 호스트에 NFS를 제공합니다. 또한 어레이에 약 90-100GB의 중복 제거 된 데이터가 있습니다.
VM 게스트와 Nexenta SSH / 웹 콘솔에 액세스 할 수 없게하고 기능을 복원하기 위해 어레이를 완전히 재부팅해야하는 두 가지 사고가 발생했습니다. 두 경우 모두 인텔 X-25M L2ARC SSD가 실패하거나 "오프라인"되었습니다. 캐시 오류에 대해 NexentaStor가 경고하지 못했지만 응답이없는 콘솔 화면에 일반 ZFS FMA 경고가 표시되었습니다.
zpool status
출력했다 :
pool: vol1
state: ONLINE
scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:
NAME STATE READ WRITE CKSUM
vol1 ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
c8t5000C50031B94409d0 ONLINE 0 0 0
c9t5000C50031BBFE25d0 ONLINE 0 0 0
mirror-1 ONLINE 0 0 0
c10t5000C50031D158FDd0 ONLINE 0 0 0
c11t5000C5002C823045d0 ONLINE 0 0 0
mirror-2 ONLINE 0 0 0
c12t5000C50031D91AD1d0 ONLINE 0 0 0
c2t5000C50031D911B9d0 ONLINE 0 0 0
mirror-3 ONLINE 0 0 0
c13t5000C50031BC293Dd0 ONLINE 0 0 0
c14t5000C50031BD208Dd0 ONLINE 0 0 0
mirror-4 ONLINE 0 0 0
c15t5000C50031BBF6F5d0 ONLINE 0 0 0
c16t5000C50031D8CFADd0 ONLINE 0 0 0
mirror-5 ONLINE 0 0 0
c17t5000C50031BC0E01d0 ONLINE 0 0 0
c18t5000C5002C7CCE41d0 ONLINE 0 0 0
logs
c19t0d0 ONLINE 0 0 0
cache
c6t5001517959467B45d0 FAULTED 2 542 0 too many errors
spares
c7t5000C50031CB43D9d0 AVAIL
errors: No known data errors
이것은 Nexenta 내에서 경고를 트리거하지 않았습니다.
L2ARC 장애가 시스템에 영향을 미치지 않을 것이라는 인상을 받았습니다. 그러나이 경우 분명히 범인이었습니다. RAID L2ARC에 대한 권장 사항을 본 적이 없습니다. 서버에서 불량 SSD를 완전히 제거하면 다시 실행되지만 장치 오류의 영향 (NexentaStor의 알림이 없음)에 대해 걱정하고 있습니다.
편집 - 요즘 L2ARC 캐시 애플리케이션을위한 현재 최고의 선택 SSD는 무엇입니까?