RAID Fusion-io 카드를 RAID해야합니까?


27

서버에 설치된 단일 Fusion-io 카드를 사용하여 안정적으로 실행할 수 있습니까 , 아니면 소프트웨어 RAID 설정에서 두 개의 카드 를 배치해야 합니까?

Fusion-io는 마케팅 자료를 검토 할 때 그 주제에 대해 명확하지 않습니다 (거의 오해의 소지가 있습니다) . 카드 비용을 감안할 때 다른 엔지니어들이 실제 시나리오에서 어떻게 배치하는지 궁금합니다.

Linux에서 실행되는 독점 독립형 데이터베이스 솔루션에 HP 브랜드 Fusion-io ioDrive2 1.2TB 카드 를 사용할 계획 입니다. 실제 고 가용성 옵션이없는 단일 서버 설정입니다. 가 이다 10 분 비동기 복제 RPO 거울 트랜잭션이 두 번째 실제 서버에 로그온 할은.

일반적 으로이 응용 프로그램에 최고 CPU 스테핑이있는 고급 HP ProLiant 서버를 지정했습니다 . SSD로 이동해야하며 필요한 용량으로 엔터프라이즈 SAS SSD보다 저렴한 가격으로 Fusion-io를 구입할 수 있습니다.

  • 두 개의 ioDrive2 카드를 실행하고 소프트웨어 RAID (md 또는 ZFS)와 결합해야합니까, 아니면 불필요합니까?
  • RAID 컨트롤러 오류 또는 마더 보드 오류에 대해 우려하는 것보다 Fusion-io 오류에 대해 우려해야합니까?
  • RAID와 같은 시스템 관리자 이 폼 팩터에서 사용할 수있는 다른 인터페이스 및 카드웨어 레벨링 / 오류 수정을 고려할 때 다른 사고 방식이 필요합니까?
  • 무엇 인가 이러한 장치의 실패율?

편집 : 방금 Dell 의 Fusion-io 신뢰성 백서 를 읽었 으며 테이크 아웃은 "Fusion-io 카드에 많은 내부 중복성이 있습니다 ... RAID에 대해 걱정하지 마십시오!" .


IOPS 제한을 적용 할 경우 소프트웨어 RAID 및 / 또는 PCIe 버스가 계속 유지됩니까? 솔직히 모르겠지만 체크 아웃 할 가치가 있습니다.
pauska

1
PCIe 버스가 유지됩니다. 소프트웨어 RAID (나는 경우 필요해 이 할 수있는, 그래서에), ZFS 기반이 될 것입니다. 지금은 두 장의 카드를 주문했지만 Fusion-io 문헌에서 "한 장의 카드로 충분합니다"라고 말합니다.
ewwhite

ZFS조차도 CPU주기를 사용하여 데이터를 미러링해야하므로 복잡성과 대기 시간이 추가되지만 특정 응용 프로그램에 영향을 미치는 정도는 알 수 없습니다. Fusion은 내부 미러링 / 보호에 대한 낮은 CPU 비용을 자랑스럽게 생각합니다.
pauska

답변:


16

궁극적으로 그것은 실패 모델에 달려 있습니다. 실패의 영향은 무엇입니까?

역사적으로 우리는 비용이 무시할 수 있기 때문에 항상 모든 것을 RAID 처리했습니다. 미러링 드라이브를위한 또 다른 $ 500? 그것을 고려하지 않고 비용의 가치.

미러링을 설정하기 위해 다른 $ 10K +에 대해 이야기 할 때는 약간 더 고려해야합니다.


아니요, 미러링 할 필요가 없습니다.

퓨전 아이오 카드는 꽤 좋은 내부 이중화가 않습니다. 이것은 디스크가 단일 칩인 종류의 하드웨어가 아닙니다. 필자가 실패를 관찰 한 대부분의 상황에서 이는 미러의 두 구성원 모두에 영향을 미쳐 RAID가 문제가되지 않은 펌웨어 문제였습니다.

Fusion-io 카드는 디스크가 뒤에있는 RAID 컨트롤러로 생각하십시오. 단일 컨트롤러 설정으로 괜찮습니까? 아마. 그렇게 취급하십시오.

Fusion-io 드라이브를 배포 할 많은 설정에는 노드 수준에서 중복성을 제공하는 다른 보호 기능이 내장되어 있으므로 그다지 의미가 없습니다.


예, 거울을 봐야합니다

RAID는 가용성을 높 입니다. 비용에도 불구하고 절대적인 최대 가용성이 필요합니까? 고장 비용과 가동 중지 시간이 비쌉니까? 계속해서 드라이브를 미러링하십시오. 통계적으로 큰 설정에서는 내부 보호 조치에도 불구하고 드라이브 오류가 발생합니다.


업데이트 : 클라이언트가 추가 비용을 지불하고 제품을 쉽게 배포 할 수있는 설치에서 Fusion-io 카드를 미러링했습니다. 다른 상황에서는 여러 개의 단일 카드 설치를 배포했습니다. 지금까지 모든 것이 잘되었습니다 ...
ewwhite

18

온 디바이스 리던던시는 실제 데이터 스토리지를 수행하는 모든 구성 요소 중 RAID와 유사한 플래시 칩의 고장에 대해서만 제대로 작동합니다.

RAID 컨트롤러 오류 또는 마더 보드 오류에 대해 우려하는 것보다 Fusion-io 오류에 대해 우려해야합니까?

전체 장치의 장애는 RAID 컨트롤러 또는 마더 보드의 손실과 거의 유사합니다. 다른 단일 장애 지점 구성 요소와 마찬가지로 Fusion-io 카드에 대해 거의 걱정할 것입니다. 하드 데이터를 사용하여 고장률을 비교할 수있는 대규모 장치 경험이 없습니다.

두 개의 ioDrive2 카드를 실행하고 소프트웨어 RAID (md 또는 ZFS)와 결합해야합니까, 아니면 불필요합니까?

장치에 이미있는 것 (예 : 여러 Fusion-io 카드 중 소프트웨어 RAID)에 중복성을 추가하는 것은 두 개의 서로 다른 RAID 컨트롤러에서 두 개의 하드웨어 RAID 그룹간에 소프트웨어 RAID를 수행하는 것과 매우 유사합니다. 추가적인 단일 장애 지점을 제거하기 위해 극도의 중복성을 보증하는 시스템에는 유용하지만 일반적인 배포에는 적합하지 않습니다 (거울의 10 분 RPO는 대부분의 응용 프로그램에 충분해야합니까?).

RAID와 같은 Sysadmin 이 폼 팩터에서 사용할 수있는 다른 인터페이스 및 카드웨어 레벨링 / 오류 수정을 고려할 때 다른 사고 방식이 필요합니까?

응, 나도 그렇게 생각해. 기본적으로 RAID 컨트롤러와 같은 장치와 하나의 패키지에 많은 저장 장치가 있습니다. 그것은 확실히 "RAID의 건강한 이해 카운터 균형을 이루어야 장치의 내부 중복에 대한 신뢰의 어떤 수준을 ... 가지고 요구를 하나의 장치에 중요한 데이터를 넣어 대해 걱정하는 유혹하지만, 자신의 것은 하지 않은 백업 "개념 : 항상 중복 구성 요소의 장애 또는 사용자가 올바른 백업으로 구성 요소의 데이터를 삭제할 수 있도록 준비하십시오.


13

아시다시피 RAID 및 비 RAID 설정 모두에서 키트를 한동안 사용했습니다. 실패한 경험이 있기를 바랍니다. 우리는 RAID가 도움을 줄 수있는 장애가 없었으며 온보드 복원 기능이 향상되었습니다. 또한 우리가 사용하는 주요 기능은 이제 수평 확장 / 클러스터 화되어 있으므로 RAID를 사용할 이유가 훨씬 적습니다. 그러나 훌륭한 카드는 적극 권장합니다.


좋은 데이터 포인트. 그러나 RAID 레이어를 추가하는 것이 과잉인지 아닌지는 알 수 없습니다.
ewwhite

1
데이터가 단일 FusionIO 카드의 손실을 지원하는 기능이 필요하거나 빠르거나 비용이 많이 드는 디스크로 생각할 필요는 없습니다. RAID없이 살 수 있습니까?
Chopper3

약간 ... 전통적인 접근 방식은 RAID 1 + 0에서 엔터프라이즈 SAS SSD를 사용하는 것입니다. 그것은 디스크를 SSD에 회전시키는 데 사용 된 것과 동일한 표준을 적용하는 것입니다. 그러나 그것은 또한 핫 스왑 기능을 가정합니다. PCIe 기반 카드에는 적용되지 않습니다. 특히 소프트웨어 RAID를 사용하여이 작업을 수행해야 할 때 특히 그렇습니다. Fusion-io는 더 나은웨어 레벨링 및 모니터링의 이점도 가지고 있으므로 여기에 관련된 현실적인 고장 모드를 이해하려고 노력하고 있습니다. Fusion-io를 디스크 나 컨트롤러처럼 취급합니까? 내장 디스크를 제공하기 위해 ProLiant에 두 개의 스마트 어레이 카드를 넣지 않습니까?
ewwhite

2
@ewwhite RAID 컨트롤러의 장애를 처리 할 수 ​​있어야하는 경우 디스크가 다른 RAID 컨트롤러 2 개와 컨트롤러 디스크간에 RAID1이있을 수 있습니다. 중복 계획의 관점에서 Fusion-io 카드를 RAID 컨트롤러처럼 취급한다고 말하고 싶습니다.
Shane Madden

@ewwhite 내가 사용한 단어를 보면 하나의 FusionIO가 장착 된 서버에서 중단 된 한 줄 사이에서 읽을 수 있습니다-우리는 mobo go pop-DL580 G6 (우리는 거의 없습니다)와 무언가를 읽었습니다. 하나의 전체 메모리 뱅크에 일어 났고 누가 보드를 꺼 냈습니다. 이 시나리오에서는 RAID 1 이었지만 분명히 중요하지 않았습니다. 물론 PCIe 핫스왑이 가능하고, 대규모 faff 일 수 있지만 제대로 작동 할 수 있습니다.
Chopper3

9

Fusion에 직접 익숙하지는 않지만 PCIe SSD 경험이 있습니다.

내가 작업하는 것은 OS에 4 개의 서로 다른 LUN을 제공하고 PCIe 카드를 HBA처럼 취급합니다. RAID를 원한다면 OS를 사용하여 두 개의 LUN을 함께 미러링합니다. 이를 통해 중복성을위한 단일 카드 솔루션을 사용할 수 있습니다. 그럼에도 불구하고 카드가 완전히 실패하면 여전히 개울입니다. ioDrive가 같은 일을하는지 모르겠습니다.


이 특정 장치는 하나의 블록 장치를 나타냅니다.
ewwhite

1
ioDrive는 하나 또는 두 개의 독립적 인 장치를 제공합니다. 두 개가 있으면 각각 자체 보호 기능이있는 하나의 카드에있는 두 개의 개별 장치입니다. 예를 들어, 각각 SSD로 취급해야하는 4 개의 장치를 제공하는 Intel 910과 비교하십시오.
MikeyB

5

지난 몇 달 동안 1.2TB 카드 6 장을 샀습니다. 그들 중 하나는 이미 실패했습니다. 그래서 나는 절대적으로 그들을 습격합니다. Windows Active Disk Mirror를 사용했습니다. "LEB 맵 누락"메시지와 함께 드라이브가 실패했습니다. 교체가 필요하다고 들었습니다. 그러나 RMA 승인을 받으려면 고장난 카드의 양면에 사진을 찍어야합니다 (카드를 꺼내려면 생산 중단이 필요함). 그리고 그들은 교체 카드에 재고가없는 재고가 없다고 말했습니다. 그래서 당신은 그들을 사기 전에 꽤 열심히 생각하고 싶을 수도 있습니다.


경험을 공유해 주셔서 감사합니다. 이 1.2TB 카드를 미러링 된 쌍으로 배포했습니다. HP SKU를 사용하고 있으므로 RMA / 교체를 처리하기위한 HP 지원 계약이 있습니다.
ewwhite
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.