일부 상황에서 "엔터프라이즈"드라이브를 니어 / 미드 라인으로 안전하게 교체 할 수 있습니까?


22

스토리지 전문가가 아닌 많은 엔지니어와 같은 서버를 지정할 때 최소 10k SAS 드라이브를 표준화하여 안전한 서버를 운영 할 것입니다 (따라서 마케팅의 노예가 될 것입니다). "시스템"데이터 (일반적으로 OS 및 경우에 따라 앱)에 대해 엔터프라이즈 급 (24x7 듀티 사이클 등)을 제공하고 성능이 중요하지 않은 비 시스템 데이터 저장을 위해 7.2k 미드 / 니어 라인 드라이브 사용을 예약합니다 인자. 3.5 "(LFF) 디스크는 대용량, 낮은 IOP 요구 사항에만 실제로 관련되므로 2.5"(SFF) 디스크를 가정합니다.

대량의 비 시스템 데이터가없는 상황에서는 일반적으로 시스템 데이터와 동일한 디스크 / 배열에 배치합니다. 즉, 서버에는 10k SAS 드라이브 만 있습니다 (일반적으로 "One Big RAID10"유형). 요즘 설정). 비 시스템 데이터의 크기가 큰 경우에만 비용 / GB를 낮추기 위해 보통 7.2k 미드 / 니어 라인 디스크의 별도 어레이에 배치하는 것이 좋습니다.

어떤 상황에서 RAID10 어레이의 10k 디스크가 큰 부정적인 결과없이 7.2k 디스크로 교체 될 수 있었는지 궁금해졌습니다. 다시 말해, 최소 10k "엔터프라이즈"등급 디스크를 고수하여 과도한 사양을 지정하고 하드웨어 공급 업체를 만족시키는 경우가 있습니까, 아니면 항상 최소 수준을 유지해야하는 이유가 있습니까?

예를 들어, 전형적인 소규모 회사 (예 : 50 명의 사용자)를 위해 몇 개의 VM을 가진 하이퍼 바이저 역할을하는 서버를 생각해보십시오. 이 회사에는 특별한 요구 사항이없는 평균 I / O 패턴이 있습니다. 일반적으로 9-5 월, 월-금 사무실, 백업은 밤에 두 시간 동안 실행됩니다. VM은 DC 및 파일 / 인쇄 / 앱 서버 일 수 있습니다. 서버에는 모든 데이터 (시스템 및 비 시스템 데이터)를 저장하기 위해 6 개의 디스크가있는 RAID10 어레이가 있습니다. 전문가가 아닌 사람에게는 미드 / 니어 라인 디스크가 제대로 작동하는 것처럼 보입니다. HP 디스크를 예로 들어 보면 :

  • 작업량 : 미드 라인 디스크의 작업량은 <40 %입니다. 사무실은 하루에 9 시간 동안 만 개설되며이 기간 동안 평균 I / O는 최대치에 거의 도달하지 않을 것이므로 워크로드가 40 %를 넘지 않을 것 같습니다. 백업을 위해 밤에 몇 시간 동안 강렬한 I / O를 수행하더라도 여전히 40 % 미만일 것입니다.
  • 속도 : 디스크는 7.2k에 불과하지만 6 개의 디스크에 분산시켜 성능을 향상시킵니다.

그래서 내 질문 : 최소 10k SAS 드라이브를 고정하는 것이 합리적입니까, 아니면 실제로 여러 상황에서 7.2k 미드 라인 / 니어 라인 디스크가 적절한 것 이상입니까? 그렇다면 라인의 위치를 ​​어떻게 측정하고 안전하게 재생하여 무지의 노예가되는 것을 피할 수 있습니까?

내 경험은 대부분 HP 서버에 관한 것이므로 위의 내용은 약간 HP 기울어 질 수 있지만 원칙은 공급 업체와 독립적이라고 가정합니다.


3
용량 및 듀티 제한 때문에 SFF 7.2k 미드 라인 디스크는 의미가 없습니다. HP 장비 (내 전문 분야) 에 대해 이야기하는 경우 SSD를 사용하지 않는 경우 900GB 및 1.2TB 10k SAS 드라이브가 가장 좋습니다. 미국에있는 경우 좋은 공급 업체가있는 경우 900GB SAS는 ~ $ 300-400이어야합니다.
ewwhite

1
사소한 문법적 불만 : "Y 대신 X 대체"라고하면 Y로 시작하여 X로 대체한다는 의미입니다.
pjc50

2
2015 년에 살고 있습니까? 몇 년 동안 내 OS 드라이브는 작은 SSD (전력 절약 등)이므로 고성능을 위해 HD를 만지지 않습니다.
TomTom

1
@TomTom 아니, 나는 2016 년입니다 :) 진지하게, 나는 그것을 정말로 고려하지 않았습니다. 필자가 말한 것처럼 요즘에는 일반적으로 "하나의 큰 RAID 10"접근 방식을 사용하므로 OS가 계속 진행됩니다. 실제로 필요하지 않은 경우 OS를 별도의 SSD로 분리하는 것은 낭비적인 것처럼 보입니다. 당신의 생각을 듣고 싶습니다. 단일 SSD 또는 미러 페어를 사용 하시겠습니까? 아마도 이것은 ... 그 자체로 좋은 SF 질문을 만들 것
DBR

1
OS 용 미러 페어. HP는 OS / 부팅 특정 SSD도 판매합니다.
ewwhite

답변:


25

서버 디자인, 디스크 기술 및 경제의 흥미로운 교차점이 있습니다.

또한 LFF (Large Form Factor) 디스크가 여전히 널리 보급되는 이유는 무엇입니까?를 참조하십시오.

  • 고밀도 랙 마운트 및 소형 폼 팩터 서버로의 이동 예를 들어 주요 제조업체의 타워 제품은 더 이상 보이지 않지만 밀도가 높은 제품 라인은 더 자주 수정되고 더 많은 옵션 / 가용성이 있습니다.
  • 3.5 "엔터프라이즈 (15k) 디스크 개발의 정지-600GB 15k 3.5"는 가능한 한 큰 크기입니다.
  • 2.5 인치 니어 라인 (7.2k) 디스크 용량의 느린 발전-2TB가 가장 큰 용량입니다.
  • 고용량 SSD의 가용성 향상 및 가격 인하.
  • 공유 스토리지에 스토리지 통합 고용량이 필요한 단일 서버 워크로드는 때때로 SAN을 통해 서비스 될 수 있습니다.
  • 올 플래시 및 하이브리드 스토리지 어레이의 성숙과 스토리지 스타트 업의 유입.

위의 이유 때문에 일반적으로 8-24 2.5 "디스크 드라이브 베이가있는 1U / 2U 서버에 중점을 둔 제조업체를 찾습니다.

3.5 "디스크는 저 IOP 대용량 사용 사례 (2TB +) 용입니다. 일부 형태의 캐싱이있는 외부 스토리지 인클로저 또는 SAN 스토리지에 가장 적합합니다. 엔터프라이즈 15k RPM 속도에서는 최대 600GB까지만 사용할 수 있습니다.

2.5 "10k RPM 회전 디스크는 더 높은 IOPS 요구를위한 것이며 일반적으로 최대 1.8TB 용량으로 제공됩니다.

2.5 "7.2k RPM 스피닝 디스크는 용량, 성능, 수명 및 가격 이점을 제공하지 않기 때문에 나쁜 전화입니다. 예 : 900GB SAS 10k 드라이브의 비용은 1TB 7.2k RPM SAS의 비용과 매우 비슷합니다. 차이점은 900GB 드라이브가 더 나은 구매이며 1.8TB 10k SAS2.0TB 7.2k SAS 의 예 에서 가격도 매우 비슷하며 보증 기간은 각각 3 년 및 1 년입니다.

따라서 서버 및 2.5 "내부 스토리지의 경우 SSD 또는 10k를 사용하십시오. 용량이 필요하고 내부 또는 외부에서 3.5"드라이브 베이를 사용할 수있는 경우 7.2k RPM을 사용하십시오.

설명한 사용 사례의 경우 서버를 과도하게 구성하지 않았습니다. 2.5 "드라이브 베이가있는 경우 실제로 10k SAS 또는 SSD 만 사용해야합니다. 미드 라인 디스크는 성능, 용량 손실, 보증 기간크게 단축 되어 비용을 크게 절약하지 못합니다.


시간을내어 함께 해주셔서 감사합니다. 내일 적절한 생각을 할 기회가 있습니다. 가격을 간단히 살펴보면 1TB 7.2k와 900GB 10k 사이에서 약 30 % 점프하는 것처럼 보입니다. 매우 크지 않습니다 (중요하다면 영국에 있습니다). 예산이 부족한 경우 여러 곳에서 합리적인 비용을 절감하려고 노력하고 디스크 선택이 그 중 하나 일 경우에 한 가지 요인이 될 수 있습니다. 순수한 기술적 관점에서 질문에 대한 귀하의 의견을 듣고 싶습니다.
dbr

기술적 인 관점에서 볼 때 7200 RPM 2.5 "디스크에는 이점이 없습니다. 비용이 너무 많이 들더라도 쇼핑을 계속하십시오.이 시장에는 큰 차이가 없습니다. 이것이 부팅 디스크 용이라면 SSD가 좋은 대안입니다. 오늘 서버에서 HP 7200 2.5 "디스크를 사용하는 이유를 생각할 수 없습니다. 또한 HP 빠른 사양을 자세히 읽으십시오. 미드 라인 드라이브는 보증 기간이 짧습니다.
ewwhite

1
일반적으로이 답변은 훌륭합니다. 그러나 다른 것과 마찬가지로 "의존한다". 900GB 10k 대 1TB 7200 디스크의 예에서 1TB 디스크는 더 시원하게 작동하므로 더 오래 지속될 수 있으며 비용도 저렴합니다. 추가 성능이 필요하지 않으면 원래 자본 비용과 운영 모두에서 돈 낭비입니다. 한 서버의 경우별로 중요하지 않습니다. 10의 경우 합산이 시작됩니다.
Dan Pritts

2
실제로 느리게 실행되는 디스크는 더 오래 지속됩니까? 누락 된 기사가 있습니까?
vasin1987

2
공급 업체 / 제조업체의 관점에서 그렇습니다. 그들이 스티어링 2.5 10K와 SSD 당신을. "당신은 흰색 권투한다면, 7200 RPM.에서의 사실을 가서, 내 ZFS 스토리지 공급 업체, PogoStorage는 사용 7200 RPM 2.5"자신의 ZFS에 대한 배열은 캐싱 및 SSD의 계층화는 제거하기 때문에 더 빠른 디스크를 지정해야합니다.
ewwhite

5

일부 드라이브 유형에 문제를 일으킬 있는 몇 가지 사항이 있습니다.

  • 많은 드라이브가있는 섀시의 진동 부하를 처리하지 않는 드라이브 (RAID / NAS 가능으로 지정된 드라이브에는 문제가 없을 것임)

  • TLER을 허용하지 않거나 드라이브를 활성화하기 위해 드라이브를 수동으로 재구성하는 데 시간이 오래 걸리는 펌웨어 (ditto)

  • 사용 된 RAID 컨트롤러로 테스트 한 적이없고 이러한 설정에서 인식 할 수없는 버그가있는 드라이브

  • 하드 셧다운시 혼동을 야기하는 방식 (물리적 쓰기가 고장 났거나 매우 지연된 방식)으로 작동하는 내부 드라이브 쓰기 캐시 (RAID 컨트롤러를 강제로 구성해야합니다. 펌웨어를 무시해야 할 경우 잠재적 인 문제 테스트되지 않은 드라이브를 참조하십시오 :)

  • 드라이브가 때때로 내부 유지 보수 루틴을 수행하여 드라이브가 느리게 작동하거나 충분한 지연으로 응답하여 RAID 컨트롤러가 실패했다고 생각하게 할 수 있습니다 (TLER 관련)

  • 일반적으로 SATA는 일반적으로 구현 되므로 컨트롤러에 모든 것을 걸거나 완전히 멈춘 전자 장치가 장착 된 드라이브에 대해 SAS에 비해 안전 장치가 적습니다 (이론적 위험은 아니며 특정 디스크 + 컨트롤러 브랜드 조합은 해당 오류 모드를 좋아합니다).


1
이는 서버 하드웨어 및 응용 프로그램 스택에 적합한 드라이브를 사용해야하는 이유처럼 보이지만 구체적으로 약 10k 대 7k2 rpm은 아닙니다.
poolie

1
"기업이 아닌 7.2k 디스크 또는 단일 드라이브 기업용으로 지정된 디스크를 응용 프로그램에 사용할 수 있습니까?"라는 질문을 쉽게 이해할 수 있습니다. "안전하게"는 일반적으로 데이터 손실 또는 고장 관련 다운 타임 위험을 해결합니다.
rackandboneman

4

거대한 문제 :

(소소한 주제가 아닌 경우도 있지만 중요하지 않습니다 ! )

SSD를 다룰 때 (종종 경우에 따라 또는 경우에 따라 또는 유혹에 해당 될 수 있음) 많은 SSD가 항상 자연 정전에서 복구 할 수없는 불쾌한 문제가 있습니다!

이것은 HDD 의 작은 문제입니다. HDD는 일반적으로 로직에 전력을 공급하기에 충분한 정전 용량과 512 바이트 블록 쓰기를 통해 플래터를 운반하기에 충분한 각 운동량을 갖습니다. A의 일단 드문 반면,이 것 없는 하나의 블록을 부분적으로 기록 될 수 있습니다 - 어떤 결과 작업은 "찢어진 쓰기"라고합니다. 부분 쓰기 (심지어 드문 경우)로 인해 블록에서 체크섬 오류가 발생합니다. 즉, 개별 블록이 불량합니다. 이것은 일반적으로 디스크 회로 자체에 의해 불량으로 감지되어 업스트림 RAID 컨트롤러에 의해 수정 될 수 있습니다.

SSD는 다른 동물입니다. 일반적으로 "웨어 레벨링"이라는 것을 구현합니다. HDD처럼 "블록 X"의 물리적 위치에 "블록 X"를 쓰지 않습니다. 대신 플래시 미디어의 다른 위치에 쓰려고 시도합니다. 그리고 약간의 버퍼링을 사용하여 쓰기를 집계하거나 결합하려고합니다. 다른 장소에 글을 쓰는 것은 물건이 쓰여지는 장소의 "지도"를 유지하는 것과 관련이 있으며, 이는 마모 레벨링을 줄이기위한 방식으로 버퍼링되고 작성됩니다. 웨어 레벨링의 일부는 이미 장치에 있고 최근에 기록되지 않은 데이터 이동을 포함 할 수도 있습니다.

이 문제는 SSD의 전원이 꺼지면 메모리에 많은 데이터가 있고 (플러스되지 않은), 다른 / 변경된 위치에 기록 된 일부 데이터가 있고,이 맵이 자체 메모리에 있어야한다는 것입니다. 장치의 모든 데이터 구조를 이해하기 위해 플러시되었습니다.

많은 SSD에는 자발적인 전원 차단시 컨트롤러를 가동 상태로 유지할 수있는 로직이나 회로가 없어서 모든 데이터가 죽기 전에 플래시로 안전하게 플러시 할 수 있습니다. 이것은 당신이 쓴 하나의 블록이 이제 jeprody에있을 수 있음을 의미하는 것이 아니라 다른 블록 은 장치의 모든 블록에 문제가있을 수 있음을 의미합니다. 또한 많은 장치는 장치의 모든 데이터를 잃을 뿐만 아니라 장치 자체 가 손상되어 사용할 수없는 문제가 있습니다.

이것은 모두 진정한 이론입니다. 그러나 (스토리지 업계에서 일하고 있습니다.)-나는 우리 자신의 개인 랩톱을 포함하여 너무 많은 장치에서 너무 많은 일이 일어나는 것을 보았습니다!

많은 공급 업체는 특별히 장치 ( "슈퍼 캡")을 추가 "기업 등급의 SSD"와 다른 회로 깨끗한 "플러시"허용을 논의했다 -하지만 모든 장치 찾기 위해 아주 아주 어렵다 특히 그것의 일부이기로 상태를 그러한 사건으로부터 충분히 명시적이고 테스트 된 보호 기능을 갖추고 있으며 그러한 사건으로부터 보호 할 것입니다.

플래시 기술을 활용 한 최상위 공급 업체로부터 "하이 엔드 스토리지 어레이"를 구입하는 경우 드라이브 또는 시스템 전체 가이 모든 것을 고려하여 설계되었습니다. 그것이 있는지 확인하십시오!

귀하의 질문과 관련된 문제는 다음과 같습니다. RAID 어레이가 있고 여러 디스크가이 보호 기능이없는 "나쁜"SSD 인 경우- "자발적인 정전"이 발생하면 MULTIPLE 디스크의 모든 데이터 가 손실 될 수 있습니다 RAID 재구성이 불가능합니다.

"하지만 UPS를 사용합니다"

일반적으로 "자발적 정전"에는 BSOD 및 커널 잠금 / 크래시 / 패닉과 같은 상황이 포함될 수 있습니다. 여기서 시스템의 플러그를 뽑아서 복구를 선택할 수는 없습니다.


2
어떤 유형의 디스크도 캐시를 플러시 할 수 없을 정도로 누군가가 디스크를 휴지통에 버리지 않는 한 매달린 시스템에서 플러그를 빨리 뽑는 경우는 드 rare니다. 이 경우 캐시가 활성화 된 기존 HDD는 브릭 킹 가능성은 적지 만 여전히 데이터 손상 가능성이 큰 동일한 엉망을 생성 할 수 있습니다. Reiserfs, 초기 NTFS는 저널 데이터를 처리하기 때문에 그로부터 셧다운되는 경향이있었습니다. 실제로 발생하지 않은 활동 (또는 순서가 잘못 된 캐시 플러시와 함께 발생할 수 있음)에 대해 작성되었습니다.
rackandboneman

2
데이터가 완전히 플러시되지 않은 경우 올바르게 설계된 SSD는 데이터를 손상 시키거나 손실하지 않습니다. 각 논리 섹터의 실제 위치는 모든 쓰기에서 변경 될 수 있으므로 업데이트가 아직 플러시되지 않은 경우 각 논리 섹터에있는 이전 버전의 데이터가 여전히 존재해야합니다. 펌웨어에 설계 결함이나 구현 버그로 인해 데이터가 손실 될 수 있습니다.
kasperd

1
@kasperd 소비자 SSD는 속도를 기준으로 판매되므로 그렇게하기 위해 타협해야합니다. 제안한 방식으로 무결성을 유지하는 것이 가능해야하지만 사실 대부분의 제조업체 드라이브는 (적어도 소비자 수준에서는) 그렇지 않습니다. 또한 EoL에 도달하면 대부분 실패하지 않습니다.
JamesRyan

@JamesRyan 일부 성능 지표에서 더 나아지기 위해 영구 스토리지로 데이터를 플러시하는 것을 부정하는 제조업체에 대한 이야기는 새로운 것이 아닙니다. 우리는 하드 디스크 시대에도 이런 일이 벌어지고 있다고 들었습니다. 소비자가 원하는 것이 아니기 때문입니다. 소비자는 일부 측정 항목 만 볼 수 있고 다른 영역에서 제조업체가 어떻게이를 속이려고했는지 알 수 없기 때문입니다. 때때로 제조업체는 부정 행위를 피하고 때로는 그렇지 않습니다. (누군가가 최근 뉴스에서 영감을 얻은 자동차 비유를 만들 수 있다고 확신합니다.)
kasperd

2
SSD는 다른 동물입니다. 데이터가 어디에 있는지 알려주는 맵 테이블이 있습니다. 그들은 데이터를 이동하고 재배치하고 이들지도를 조정하고 있습니다. 쓰기 증폭을 피하기 위해 쓰기를 통합 (즉, 지연, 묶음 및 나중에 쓰기)해야합니다. 지도 자체는 공격적으로 쓰여질 수 없으며 동일한 규칙을 따라야합니다. 우리는 "적절한 디자인"과 결함에 대해 할 수 있지만 SSD는 단순한 파일 시스템처럼 단순하지 않습니다. 나는 많은 경험, 테스트, 사양에서 말하고 있으며, 직장에서 한두 세 명의 제조업체와 이야기했을 수도 있고 그렇지 않을 수도 있습니다.
Brad
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.