미러링 모드 RAM : 그만한 가치가 있습니까?


18

블레이드 서버 설정을위한 인텔의 "미러 채널 모드"에 익숙하지 않습니다 (베어 메탈 블레이드에서 실행되는 중간 정도의 무거운 MySQL OLTP 데이터베이스 (현재 가상화는 없음)).

인텔 문서에서 다음을 찾을 수있었습니다.

인텔 제온 프로세서 5500 시리즈 및 인텔 제온 프로세서 5600 시리즈는 채널 미러링을 지원하여 미러링 된 구성에서 사용 가능한 DDR3 DIMM 채널을 구성합니다. 미러링 된 구성은 메모리의 중복 이미지이며 산발적으로 수정할 수없는 오류가 있어도 계속 작동 할 수 있습니다. 채널 미러링은 동일한 두 개의 메모리 데이터 이미지가 유지되어 최대 중복성을 제공하는 RAS 기능입니다.

인텔 제온 프로세서 5500 시리즈 및 인텔 제온 프로세서 5600 시리즈 프로세서 기반 인텔 서버 보드에서 미러링은 여러 채널에 걸쳐 이루어집니다. 활성 채널은 기본 이미지를 보유하고 다른 채널은 시스템 메모리의 보조 이미지를 보유합니다. 인텔 제온 프로세서 5500 시리즈 및 인텔 제온 프로세서 5600 시리즈 프로세서의 통합 메모리 컨트롤러는 읽기 트랜잭션을 위해 두 채널간에 번갈아 나타납니다. 정상적인 상황에서는 쓰기 트랜잭션이 두 채널에 모두 발행됩니다.

그러나 나는 그들이 여기에 누워있는 것을 실제로 선택하지는 않습니다. 스토리지 용량의 절반을 잃었지만 메모리의 "중복성"과 읽기 / 쓰기 성능 이점이 있습니까? RAM 용 RAID 1처럼? 이 구성에 대한 실제 경험이 있습니까?

답변:


7

개인적으로 하드웨어 수준의 탄력성보다는 어떤 형태의 클러스터링을 더 빨리 사용하려고합니다. 디스크와 같은 저렴한 구성 요소는 두 배가되는 것이 합리적이지만 미러링 메모리는 훌륭하지만 유용하지는 않습니다. 나는 실패 할 가능성이 더 높은 것을 의미한다. CPU, OS, 소프트웨어, mobo, PSU / s 더 빨리 돈을 클러스터링에 넣었습니다.


1
내 생각은 정확히 : 매우 특정한 장애 지점에 확실히 유용하지만 다른 블레이드 또는 2 개 (및 다른 데이터 센터의 다른 섀시)로 클러스터링 경로를 이동하여 더 많은 HA "상자"를 선택할 수 있습니다.
gravyface

1
일정을 잡거나 일정 프레임 내에서 계산을 수행해야하는 경우 클러스터링이 도움이되지 않습니다. 상황에 따라 장애 조치가 수행하는 데 필요한 작업보다 시간이 오래 걸림
Jim B

7

"RAID 1 for RAM"은 정확한 설명입니다. 내 경험상 성능상의 이점은 많지 않지만 버스 속도 대 모듈 속도에 따라 마일리지가 다를 수 있습니다.

이중화가 진행되는 한, 모듈이 잘못 작동하는 것은 끔찍한 일이 아닙니다.

개인적으로 미러링이 활성화 될 때마다 미러링을 끕니다.


2
고마워 셰인. 전 / 후에 벤치마킹을 한 적이 있습니까?
gravyface

@gravyface 불행히도 내가 가지고 있다고 말할 수는 없습니다. 데이터베이스 서버 및 vm 호스트와 비교했을 때 눈에 띄는 성능을 보지 못했습니다. 어려운 숫자는 확실히 좋을 것입니다.
Shane Madden

2
그런 다음 몇 가지 벤치 마크를 수행하겠습니다. 차이가 있는지 확인하십시오. 오류 수정 혜택이 실질적인 혜택처럼 들릴 수는 없지만 어떻게 작동하는지 궁금합니다. 추가 답변을 며칠 기다렸다가 올바른 것으로 표시하겠습니다.
gravyface

나는 희미하게도 꾸준히 나빠지는 것을 본다. 그러나 환경의 크기를 감안할 때 나는 2 주마다 1 개씩 희미 해져야한다 (통계적으로 말하기)
Jim B

4

나는 이런 종류의 것들 (CPU로도 할 수 있음)이 거대한 슈퍼 컴퓨터 클러스터에서 매우 유용하다는 것을 읽었습니다.

이러한 클러스터 중 일부는 너무 많은 시스템을 실행하여 2 시간마다 시스템 장애가 발생합니다. 작업이 완료 할 수있는 것보다 빠릅니다. 그것은 실제로 계산을 망칩니다. 이와 같은 중복성을 각 노드에 추가하면 장애 발생 시간을 두 배 이상 늘릴 수 있습니다.


그래서 이것은 이제 주류로 흘러 들어가는 고급 소재입니다. 실제로 내 요구에 많은 가치를 보지 못합니다. 그래도 고마워.
gravyface

예, 고급입니다. PC에서 핫 플러그 ​​CPU와 CPU 미러링 (!)이 나올 때까지 기다리십시오. 메인 프레임이 실패하면 다른 CPU로 전환 할 수 있습니다.
TomTom

3

이 메모리 모드는 실제로 고 가용성이 필요한 상황을 위해 설계되었습니다. 한 채널의 손실이 정상 작동에서는 눈에 띄지 않기 때문에 성능 차이가 크지 않아야하지만 실제로는 많은 램이 손실됩니다. 미러링을 활성화하면 2 개의 DIMM 슬롯이 기본 채널이고 2 개의 DIMM 슬롯이 백업 채널이며 2 개의 DIMM 슬롯이 사용되지 않기 때문에 총 메모리의 1/3 만 사용할 수 있습니다. (적어도 그것이 IBM에있는 방법입니다)

나는 일반적으로 램을 좋아하는 앱이나 OS가 있다면 그것을 끄거나 (얼굴 보자 : 그렇지 않은가?) IBM의 ex5 칩셋으로 업그레이드하기 위해 저장하는 것이 좋습니다 (hp 및 기타) 더 많은 QPI를 추가하는 유사한 오퍼링을 따르십시오.

간혹 "이 서버는 실행 된 샷 수에 관계없이 작동해야합니다."이 중복 유형이 도움이됩니다. 추가로 품질이 낮은 램보다 적게 구입하면 블루 스크린 또는 2에서 절약 할 수 있습니다.


예, 지금 당장 필요하지 않습니다. 분명히 다운 타임을 좋아하는 사람은 없지만 HA를 해결할 때 가장 확실하게 클러스터링을 고려할 것입니다.
gravyface

1
"2 주마다 불량 DIMM 하나 확인"에 대한 응답으로 유예 기간이 지나면 불량 DIMM이 얼마나 자주 표시됩니까? 프로덕션 환경에서 한 번 나쁜 RAM을 가지고 있다는 것을 기억할 수 없습니다. 나는 보통 전형적인 작업량에서 처음 몇 시간 / 일을 알아 차립니다.
gravyface

Google의 결과는 Google이 cs.toronto.edu/~bianca/papers/sigmetrics09.pdf를 보는 비율을 반영합니다 . 우리는 서버가 완전히 채워진 보드와 메모리가 많은 응용 프로그램을 많이 구성했습니다. 내 VMware 환경 중 하나를 살펴보면 완전히 채워진 18 개의 IBM hs22vs (324 개 딤)에 3 개의 잘못된 딤이 표시됩니다.이 서버는 약 1 년 동안 가동되었습니다.
Jim B
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.