데스크탑 PC에서 ECC RAM을 사용하면 확실한 이점이 있습니까?


21

충돌, 재부팅, 재미있는 동작 등을 절대적으로 싫어한다는 점에서 안정적인 시스템을 구축하는 데 많은 어려움을 겪습니다. 따라서 ECC RAM 오류 수정은 메모리 오류와 같은 큰 문제를 해결하는 것처럼 보입니다.

그러나 실제로 작동합니까? 충돌이 적거나 다른 행동과 같은 측정 가능한 이점이 있습니까?

비용 외에도 새로운 PC 빌드에 ECC 메모리를 사용하지 않겠습니까? ECC 기능이 주로 서버 / 워크 스테이션 급 컴퓨터에 사용 가능하고 지원되지만 소비자 지향 마더 보드에는없는 이유는 무엇입니까?


1
예, ECC는 소프트 오류에 대해 실제로 유용합니다. 메모리 액세스 오류가 발생하면 소프트 오류로 인해 시스템이 중단 될 수 있습니다. 단일 오류로 인해 10 억 달러 규모의 산업이 중단되었다고보고되었습니다. 이에 대한 자세한 참조 는 다음과 같습니다 .
user984260

답변:


10

몇 년 동안 서버에서 ECC 램을 사용했습니다. ECC는 "하루에 12-16 시간 이상 작동"과 같이 기기를 많이 사용할 때 실제로 빛납니다. ECC없이 구축 한 작은 화이트 박스 서버는 조만간 재부팅해야하는 "문제"를 개발했지만 ECC 시스템에는 이러한 문제 가 없었 습니다.

내 대답은 컴퓨터 를 많이 사용한다면 가능할 것입니다. 컴퓨터를 24 시간 연중 무휴로 사용하는 경우 필수품이어야합니다.

ECC를 지원하는 일부 마더 보드가 있습니다. 그것들은 보통 "더 높은"것들의 끝에 있지만, 약간의 연구를 통해 다양한 제조업체들로부터 그것들을 찾을 수 있습니다. 다른 고려 사항은 BIOS에서 ECC 지원을 활성화하는 것입니다.


구글은이 문제에 대해 흔들리고있다. 이것이 오늘날의 시스템에 실제로 미치는 영향에 대해서는 http://blogs.zdnet.com/storage/?p=638 을 참조하십시오 .


8
"ECC없이 구축 한 작은 화이트 박스 서버는 조만간 재부팅이 필요한 '문제'를 개발했습니다."– 이것은 내 취향을위한 약간의 묵시적 / 부두 컴퓨팅입니다.
Jeff Atwood

4
그리고 당신은 내가 그것을 모른다고 생각합니까? 이상한 문제가 있는 동일한 하드웨어 (메일이 잘못 전달됨) 에서 동일한 소프트웨어를 어떻게 설명 할 수 있습니까? 그러나 모든 RAM을 교체 한 후에도 문제가 저절로 해결 됩니까? 나도 그 아이디어가 마음에 들지 않지만 그것이 변경해야 할 유일한 주요 구성 요소라는 점을 감안할 때 ECC 업그레이드 후 사라지는 문제와 관련 하여 무시하기는 어렵습니다 ...
Avery Payne

1
또한 ECC 업그레이드 전에 RAM이 한 번 교체되어 문제가 지속되는 것도 언급하지 않았습니다. 어쩌면 그것은 mobo에 나쁜 흔적이었습니다. 보드의 디자인 결함 일 수 있습니다. 나는 EE가 나와서 범위를 조사해야 할 다른 많은 문제가 있었을 지 모른다고 생각하지만, ECC는 다른 이유가 없다면 하루 종일 문제를 해결했습니다. RAM에서 가져온 데이터가 100 % 일관된 상태인지 확인하십시오. 제프, 나는 그것이 부두라고 동의한다. 나는 그것을 좋아하지 않지만 거기에있다.
에이버리 페인


6

ECC가 서버에 필요할 때만 사용할 가치가 있다고 생각 합니다. 위키 백과 :

컴퓨터 시스템의 오류 감지 및 수정은 유행에 뒤 떨어진 것처럼 보입니다. 시모어 크레이 (Seymour Cray)는 CDC 6600에서 이것을 왜 버렸는지 물었을 때 "패리티는 농부를위한 것이다"라고 유명하게 말했다.

인터넷에서 기가 바이트 당 한 달에 한 번의 비트 오류가 발생했다고 주장하는 것 외에는 결정적인 소스를 찾을 수 없습니다. 이것이 원격으로 사실이라면 전 세계에서 서버가 좌우로 충돌 것입니다.

실제 서버 관리자 의 MetaFilter 스레드의 주요 특징 :

ECC는 멋진 일이라고 생각하지만 서버가 있거나없는 서버를 가지고 있으며, 존재 여부에 관계없이 어떤 식 으로든 아무것도하지 않습니다.

나는 ECC RAM의 목적을 이해하지만 요점은 이해하지 못한다. 나는 우주 광선이 뒤집혀서 어떤 문제도 발견 한 적이 없다. 여러 해의 가동 시간을 가진 개인 컴퓨팅 / 컴파일 서버에서도 마찬가지입니다. 비트가 뒤집 히지는 않았지만 확실히 중요하지 않았습니다.

여기저기서 수천 대의 기계를 운영하는 농장에서 Ext3가 ECC로 수정 가능한 문제보다 조용히 ke을 가능성이 큽니다.

개인적으로 ECC는 약간화물이 많지만 비용 프리미엄이 너무 높지 않은 한 대형 서버에서 합리적인 보험 정책이라고 생각합니다.


왼쪽과 오른쪽이 충돌합니까? 나는 그것이 그렇게 나쁘지 않을 것이라고 생각합니다. 흥미있는 re : "왼쪽 및 오른쪽 충돌"... 그러나 고려할 사항 : 할당되지 않은 RAM (슬롯, 사용률이 낮은 서버의 슬롯) 또는 할당 된 메모리가 해제 및 재 할당되기 전에 다시 실행되거나 참조되지 않는 비트 오류가 발생할 수 있습니다 (예 : 죽은 코드에 약간의 오류가있는 경우 소리가 나옵니까?)
Chris W. Rea

또한 Google이 메모리 오류에 대해 할 말이 있는지 궁금합니다. 그들은 TON의 서버를 운영합니다. fritz의 전원 공급 장치가 아닌 RAM 오류로 인해 서버 다운 타임이 얼마나 많은지 궁금합니다.
Chris W. Rea

3

우리는 중요한 시스템을 위해 이것을 고려했습니다. 한 가지 문제는 메모리 무결성 검사를 실행하는 데 사용 된 프로그램 자체가 메모리 오류를 일으킬 수있는 경우 메모리 무결성을 확인하기 위해 소프트웨어에서 오류 감지를 어떻게 수행 하는가입니다. ?? 기본적으로는 실패 모드 분석 / 실패 완화가 불가능하므로 ECC는 완화 메커니즘입니다.

이것은 문제가있는 경우 실제로 우주 광선을 비난 할 수있는 경우 중 하나입니다 .)


2

나는 "임무 중요"응용 프로그램을위한 ECC 램을 고려할 것입니다. 서버 오류로 인해 상당한 금액의 돈을 잃거나 사람들을 죽이는 경우 ECC 램이 발생합니다. 기본적으로 ECC 램 비용과 오류 발생시 손실되는 비용을 비교해보십시오.

그러나 무엇을 결정하든 밤새 MemTest86 +를 실행하는 것이 좋습니다 (또는 전체 주소 공간을 여러 번 통과 할 수있을 정도로 길어야합니다). 그리고 문자 그대로 열을 켤 수 있다면 시스템이 뜨거울 때 램의 성능에 대한 아이디어를 얻을 수 있습니다.

MemTest에서 새로운 RAM 전시회 오류가 발생했습니다. 또한 MemTest가 감지 한 "좋은"램 개발 오류가 시간이 지남에 따라 발생했습니다. 훌륭한 도구이며 새로운 시스템에서 처음으로 실행하는 것 중 하나입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.